OCRで考え込む

 昨日も少し書いたOCRに今日も引き続き悩んでます。
 ちなみにOCRとは、Optical character recognitionの略で、光学文字認識という活字の文書の画像をコンピュータが編集できる形式に変換するソフトウェアのことです。

 これが手軽に使えたら、本に載ってる良い言葉をデータで取り込んでソーシャルやらブログのネタに使えて便利!と思ったのがきっかけで、そこからペン型スキャナとかを経て、スマホがあるじゃんと気づき調べ始めたという感じです。

 ただ、スマホ版のOffice Lens、CamScanner、Evernote(これだけはちゃんと試せてないかも)の三つを試したところ、変換精度がダメダメでかなり滅入ってしまいました。
 余談ですが、Brotherの複合機についてきたPresto! PageManagerのOCR機能とスキャナの併用はかなり良く、紙焼きとかアウトライン後のPDFしか原稿がないような仕事(そういう案件は減りましたが)で使えるレベルの精度です。

[amazonjs asin=”B003CIEGE8″ locale=”JP” title=”Presto! PageManager 9 Professional”]

Presto! PageManager 9.5 Pro (Windows) / デジタルドキュメント / パーソナルソリューション / 製品 / Welcome to NewSoft!

 このクオリティの差にはかなり引っかかるものがあり、スマホのアプリ全般へ疑問だったり、スマホ版OCRを紹介している記事や人に対する「本当に使った?」という不信だったりに繋がっています。
 …なんかそういう精度の低いアプリとそれを使わないで支持する人によって、ちゃんと使える道具が淘汰されて、最後にガラクタだけが残るというのが最近の不安だったりします。

 などと大げさなことを書きましたが、よくよく考えるとぼくみたいなフリーランスにOCRがどれくらい必要か怪しかったりします。
 上記でも少し触れましたが、最近では仕事で使う原稿はほとんどテキストデータとして支給されるし、あとで読むために残すならレイアウトが維持される画像データの方が見やすいです。
 大昔からネットをやっているぼくには画像のデータは重いという意識がありますが、それも回線の高速化や記録メディアの大容量化によって気にしなくて良くなってきました。
 などと分析すると、古くさい思い込みを満足させている部分も大きいかなと思います。
…って、自炊ユーザーからしたら何を古くさいこと言ってるんだと笑われそうですね(汗

 一方でOCRは画像抽出したテキストを翻訳してアウトプットしたりなど、素晴らしい進化が着々と進んでおり、むしろそういう展開の方に注目したらいいのかしら。