Python

スポンサーリンク
AWS

[Docker]DockerもProxy設定が必要だけど、ログから読めなかった話

単に、Proxy環境下ではDockerもProxy設定が必要だったという話 PythonでAWSのlambdaをローカル開発しようとしたとき、Dockerの起動でエラーが出たので、情報を残しておきます。 似たような話にいつもハマってしまうの...
Python

[Python]tkinterを使って画面やボタンなどを表示させてみた

Pythonって統計・解析処理系でよく使うイメージがあって、GUIアプリは作ったことなかった。 PDFや画像を解析するとき、解析に使うパラメータでどう結果が変わるか視覚的判断するために、作ってみました。 ※これまでもグラフ(matplotl...
Python

[Python]Windowsアプリ(exeファイル)を作る

PythonでWindows上で動くGUIアプリを作ったのですが、Python環境がないパソコンでも使ってもらおうと、exeファイルの生成方法を調べました。 PyInstallerでexeファイルを生成できます。 公式:Using PyIn...
Python

[Python]正規表現・改行含む複数行マッチング・繰り返しマッチング・複数条件マッチング

Pythonで、掲題通り、改行を含んだ文字列を検索とか置換を行いたくて、その正規表現について調べました。 対象文字列の例 ※日本語の文字列です 以下の文字列が、test_textに代入されているケースを想定 あああ いいい [start:う...
Python

[Python][tesseract]画像ファイルを光学式文字認識(OCR)を使って文章抽出する

前回の続き。 OCRによる文章抽出において、Google Cloud Vision APIを使った場合とtesseractを使った場合を比較しようかなと思い試していました。 結果的に、精度は、Google Cloud Vision APIの...
Python

[Python][Google Cloud Vision API]画像ファイルを光学式文字認識(OCR)を使って文章抽出する

Google Cloud Vision APIを使って、OCRによる文章抽出を行いました。 そもそもは、PDFの文章抽出を行おうとしており、PDFファイルそのものをOCRにかけることはできないため、 PDFからPNGファイルに変換して、画像...
Python

[Python]PDFファイルをページ毎にpngへ変換する

PDFファイル内の文章を光学式文字認識(OCR)にかけてみようと思い、その前準備として、 PDFファイルの内容を一括で画像ファイルに変換するコードを書いたときの話です。 Python3.7で確認しました。 pdf2imageというパッケージ...
Python

[Python]たまに使うけど、書くのがめんどくさく、コピペしたいコード

キーボード打つのがめんどくさかったけど、 たまにしか出てこないので、コピーするときに探すことがあったので。 ここに書くと、次からはタイプするような気もする。 環境はpyhon3.7 文字列のリスト配列から、任意の文字列を含む要素を取り出す方...
Python

[Python]TypeError: initial_value must be str or None, not bytes

どこかからコードをコピーしてそのまま使おうとしてエラーだった話。 そのコードがPython2系のコードだったのが原因だった。 エラーメッセージ TypeError: initial_value must be str or None, no...
Python

[Python]エラー対処法(TypeError: a bytes-like object is required, not ‘str’)

確か、APIレスポンスやファイル内から取得したデータをreplaceメソッドなどで変換しようとしたときに発生したエラーだったと思います。 プロトタイプ的に実装していた時だったので、あまり型チェックなどを意識しておらず、対象の変数がbytes...
スポンサーリンク