技術系

スポンサーリンク
Python

[Python][Google Cloud Vision API]画像ファイルを光学式文字認識(OCR)を使って文章抽出する

Google Cloud Vision APIを使って、OCRによる文章抽出を行いました。そもそもは、PDFの文章抽出を行おうとしており、PDFファイルそのものをOCRにかけることはできないため、PDFからPNGファイルに変換して、画像ファ...
Python

[Python]PDFファイルをページ毎にpngへ変換する

PDFファイル内の文章を光学式文字認識(OCR)にかけてみようと思い、その前準備として、PDFファイルの内容を一括で画像ファイルに変換するコードを書いたときの話です。Python3.7で確認しました。pdf2imageというパッケージを使用...
Python

[Python]たまに使うけど、書くのがめんどくさく、コピペしたいコード

キーボード打つのがめんどくさかったけど、たまにしか出てこないので、コピーするときに探すことがあったので。ここに書くと、次からはタイプするような気もする。環境はpyhon3.7文字列のリスト配列から、任意の文字列を含む要素を取り出す方法str...
Python

[Python]TypeError: initial_value must be str or None, not bytes

どこかからコードをコピーしてそのまま使おうとしてエラーだった話。そのコードがPython2系のコードだったのが原因だった。エラーメッセージTypeError: initial_value must be str or None, not b...
Python

[Python]エラー対処法(TypeError: a bytes-like object is required, not ‘str’)

確か、APIレスポンスやファイル内から取得したデータをreplaceメソッドなどで変換しようとしたときに発生したエラーだったと思います。プロトタイプ的に実装していた時だったので、あまり型チェックなどを意識しておらず、対象の変数がbytes型...
Linux

[Ubuntu]How can I install pdftk in Ubuntu 18.04

PDF解析を行っている際に、pdftkというツールを使えば、効率よさそうというケースがあったので、ひとまず入れようとしました。そこで詰まった話です。環境Windows10 上のWindows Subsystem for Linux (WSL...
Docker, Vagrant, VirtualBox

[Docker]イメージ取得でタイムアウトエラー、パスワード付きproxy設定で解決

環境Windows10Docker version 18.09.2, build 6247962>verMicrosoft Windows >docker -vDocker version 18.09.2, build 6247962現象イ...
Machine Learning, 機械学習

TensorFlowでワーニング

TensorFlowの設定中Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2あなたの CPU は、このコンパイル...
tool類

[Markdown]初期設定やパッケージ情報

パソコンが変わったときに、同じ環境にするためにインストールしているパッケージや設定についての情報を残しておきます。利用者情報KotlinやSwiftなどスマホアプリ開発歴が長いPythonもそこそこ使うが、JavaScriptなどWeb系は...
Python

[Python]AttributeError: ‘NoneType’ object has no attribute ‘rstrip’

以下のようなコードを書きました。2か所エラーがありました。環境は、Python3.7、Windows10if cc.endswith(b'stream'): strpos = f.tell() while 1: # ll...
スポンサーリンク