pdfminer.sixでImageを抜き出そうとしたときに、
PILというライブラリがないと言われました。
※pdfminerは、PythonでPDFから文字列を抽出するためのライブラリです。
公式にも書かれていますが、Image抽出には弱いです。
$ python pdf2txt.py input\test.pdf -t xml -o res.xml -O outputDir
~~~省略~~~
File "C:\~~~\pdfminer\image.py", line 87, in export_image
from PIL import Image
ModuleNotFoundError: No module named 'PIL'
よく見るエラーなので、インストールを試みます。
$ pip install PIL
Collecting PIL
Could not find a version that satisfies the requirement PIL (from versions: )
No matching distribution found for PIL
。。。ないよと。
どうやらPython2.7までのライブラリだったようです。
Python3系では、pillowを入れることで対応できるようです。
$ pip install pillow
コメント