OCR

スポンサーリンク
Python

[Python][tesseract]画像ファイルを光学式文字認識(OCR)を使って文章抽出する

前回の続き。OCRによる文章抽出において、Google Cloud Vision APIを使った場合とtesseractを使った場合を比較しようかなと思い試していました。結果的に、精度は、Google Cloud Vision APIの方が...
Python

[Python][Google Cloud Vision API]画像ファイルを光学式文字認識(OCR)を使って文章抽出する

Google Cloud Vision APIを使って、OCRによる文章抽出を行いました。そもそもは、PDFの文章抽出を行おうとしており、PDFファイルそのものをOCRにかけることはできないため、PDFからPNGファイルに変換して、画像ファ...
Python

[Python]PDFファイルをページ毎にpngへ変換する

PDFファイル内の文章を光学式文字認識(OCR)にかけてみようと思い、その前準備として、PDFファイルの内容を一括で画像ファイルに変換するコードを書いたときの話です。Python3.7で確認しました。pdf2imageというパッケージを使用...
スポンサーリンク