Python[Python][Google Cloud Vision API]画像ファイルを光学式文字認識(OCR)を使って文章抽出する Google Cloud Vision APIを使って、OCRによる文章抽出を行いました。そもそもは、PDFの文章抽出を行おうとしており、PDFファイルそのものをOCRにかけることはできないため、PDFからPNGファイルに変換して、画像ファ... 2019.11.02Python
Python[Python]PDFファイルをページ毎にpngへ変換する PDFファイル内の文章を光学式文字認識(OCR)にかけてみようと思い、その前準備として、PDFファイルの内容を一括で画像ファイルに変換するコードを書いたときの話です。Python3.7で確認しました。pdf2imageというパッケージを使用... 2019.11.01Python
Python[Python]たまに使うけど、書くのがめんどくさく、コピペしたいコード キーボード打つのがめんどくさかったけど、たまにしか出てこないので、コピーするときに探すことがあったので。ここに書くと、次からはタイプするような気もする。環境はpyhon3.7文字列のリスト配列から、任意の文字列を含む要素を取り出す方法str... 2019.10.29Python
Python[Python]TypeError: initial_value must be str or None, not bytes どこかからコードをコピーしてそのまま使おうとしてエラーだった話。そのコードがPython2系のコードだったのが原因だった。エラーメッセージTypeError: initial_value must be str or None, not b... 2019.09.11Python
Python[Python]エラー対処法(TypeError: a bytes-like object is required, not ‘str’) 確か、APIレスポンスやファイル内から取得したデータをreplaceメソッドなどで変換しようとしたときに発生したエラーだったと思います。プロトタイプ的に実装していた時だったので、あまり型チェックなどを意識しておらず、対象の変数がbytes型... 2019.09.11Python
Linux[Ubuntu]How can I install pdftk in Ubuntu 18.04 PDF解析を行っている際に、pdftkというツールを使えば、効率よさそうというケースがあったので、ひとまず入れようとしました。そこで詰まった話です。環境Windows10 上のWindows Subsystem for Linux (WSL... 2019.08.10Linux
Docker, Vagrant, VirtualBox[Docker]イメージ取得でタイムアウトエラー、パスワード付きproxy設定で解決 環境Windows10Docker version 18.09.2, build 6247962>verMicrosoft Windows >docker -vDocker version 18.09.2, build 6247962現象イ... 2019.07.25Docker, Vagrant, VirtualBox
Machine Learning, 機械学習TensorFlowでワーニング TensorFlowの設定中Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2あなたの CPU は、このコンパイル... 2019.07.25Machine Learning, 機械学習
tool類[Markdown]初期設定やパッケージ情報 パソコンが変わったときに、同じ環境にするためにインストールしているパッケージや設定についての情報を残しておきます。利用者情報KotlinやSwiftなどスマホアプリ開発歴が長いPythonもそこそこ使うが、JavaScriptなどWeb系は... 2019.07.18tool類
Python[Python]AttributeError: ‘NoneType’ object has no attribute ‘rstrip’ 以下のようなコードを書きました。2か所エラーがありました。環境は、Python3.7、Windows10if cc.endswith(b'stream'): strpos = f.tell() while 1: # ll... 2019.05.20Python