Evernote特集『OCR精度はどの程度あるのか』


前回はEvernoteの簡単なレビューを行いました。さらに詳しい操作方法についてはGoogle教授に聞いてもらって、今回はEvernoteのミソとなるOCR精度がどのくらいなのか実験してみました。

・jpgファイルは『Paint.net』のjpg作成時の圧縮率を使い、100,75,50,30,10,5,1の7種類を用意。
・検索語句を打ち込み、どのくらいまで読み取れるのかをみてみる。

サンプルとしたのは『Stay hungly. Stay Foolish』で有名なスティーブジョブズのスピーチ冒頭部分を画像として取り込みました。

■まずは『Jobs』。タイトルに含まれているので、なんとすべての画像で読み取りをしてくれました。

■次に『commencement』小さい字ですが、よく読んでくれました。

■さらに『graduation』これは圧縮率10ですが、小さい字なのによく読めています。

ほかの単語を試してみたい方はノートブックを公開しておきましたのでどうぞ。
http://preview.evernote.com/pub/haaya/test/

今はまだ日本語への対応が不十分ですが、非常に期待度大のサービスです。日本語のOCRについてはWS011shの名刺リーダーが非常に有名ですが、今度特集をしてみます。

SNSでもご購読できます。