pdf2image라는 모듈이 있으나 poppler에서 계속 오류가 났던 나는 차선책을 찾게 되었는데, 속도 면에서는 얼마나 차이가 나는지는 모르겠지만 일단 내가 PyMuPDF를 사용해 본 결론으로는 굉장히 느리다ㅋㅋ... 코드도 느릴만하긴하지만.. 그래도 PyMuPDF는 원하는 PDF 페이지만을 선택해서 이미지화 할 수도 있기 때문에 나름 유용하다.
사실 pdf 파일을 이미지로 바꾸기만 하면 되는거 아니겠어? pdf2image모듈을 못 사용하니 꿩 대신 닭을 사용했다.
PyMuPDF
pip install -U pymupdf 를 한 후,
이 방식으로 png 파일로 만들 수 있는데, 이 png 파일을 jpg 파일로 바꾸고 싶다면... Pillow를 사용해도 될거같고 사실 걍 저 확장자만 바꿔줘도 될거같기도 하고.. (그렇다 png를 jpg로 바꿔주면 또 그렇게 잘 됨 굿 ^^)
암튼! 다들 pdf2image에 고생하지 말고 나처럼 꿩대신 닭으로도 도움 얻길!
'코딩 > Python' 카테고리의 다른 글
pd.read_csv utf-8 오류나는 경우 (0) | 2021.09.27 |
---|---|
tqdm 사용하기 (0) | 2020.12.02 |
판다스 이해하기 - 시리즈에서 문자열 조작하기 (0) | 2020.07.20 |
판다스 이해하기 - 분할, 더미변수, 문자형 날짜형 변환 (0) | 2020.07.16 |
판다스 이해하기 - 조건문, concat, append, 그룹화, 함수적용, join (0) | 2020.07.16 |