tabula

スポンサーリンク
Python

[Python]tabulaで表抽出したら、空の表や、空のセルがむっちゃでたので、無理やり対応した思い出

pdfから表を抽出するライブラリを使っていた時の話。 tabulaを使っていたけど、表抽出って汎用的にやるのが難しいので、どうしてもターゲットになる表に対して、力業で読めるようにしてあげる必要がある。 以下のようなイメージで取得したところ、...
Python

[Python]tabulaが起動しない場合の対策。(ArgumentError) invalid byte sequence in Windows-31J

解決策 exeファイルを叩いて実行するのではなく、 コマンドプロンプトでRUBYOPTにUTF-8を設定する。 set RUBYOPT=-EUTF-8 tabula.exe ※Windowsの環境変数として設定することでも対処可能 事の発端...
スポンサーリンク