
人の手で行っていたシステムやExcelへのデータ入力作業の効率化のため、AI OCRの導入を検討する企業が増えています。しかし、どのツールも高精度化、多機能化しており、どれを選んだらよいのか悩んでしまいます。
今回は、AI OCRの導入を検討している方向けに、比較するべきポイントを「文字認識の設定」「機能」「セキュリティ」「料金」の4つに絞ってご紹介します。AI OCRの違いが分からない方や何を基準に選べばよいか迷っている方のために、実務で使えるチェックポイントもあわせて紹介します。
場所を指定?それとも項目名で指定?文字認識の方式で比較
OCRが文字認識をする際、大きく分けて、領域指定タイプと項目抽出タイプの2つの方式があります。どちらの文字認識方式が業務に合っているか、確認しましょう。
定型帳票で高精度な領域指定タイプ
領域指定タイプは、「この帳票のここに取引先名、ここに金額、ここに日付がある」といった具合に、文字が書かれている位置をあらかじめ指定しておく方式です。帳票ごとに細かくレイアウトを設定できるので、定型帳票が多い業務では特に力を発揮します。
また、後述の項目抽出タイプとは異なりその場所を文字認識するため、似た項目の取り違えは発生しません。結果の正確性は高いといえます。
帳票ごとに定義を作る必要があるため、設定に手間がかかることが最大のデメリットです。
非定型に強い項目抽出タイプ
「取引先名」「金額」「日付」といった項目の名前を指定することで、帳票の様式によらず、該当する項目を抽出するタイプです。様式ごとに設定しなくてよいため、設定は簡単になります。
特に、レシート、領収書のようにフォーマットがバラバラな非定型帳票を扱う場合は、この項目抽出タイプが候補になります。
一方で、似たような項目が並んでいる場合、別の項目を取り間違えることもある分、正確性は領域指定タイプに劣ります。
くわえて、帳票によって「金額」「合計金額」「計」などの表記の揺れをどこまで理解して抽出できるかはツールにより差が出るところです。

認識精度や便利な機能面の比較
次に機能、性能について、見ていきましょう。認識精度はもちろんですが、単純に書いてあることをそのままテキストデータ化できればよいのか、それとも、何かしらのルールに基づいて変換や補正ができた方がよいのか。用途によって必要不必要があるはずですので、参考にしてみて下さい。
読み取り精度
認識精度は良いに越したことはありません。昨今、AI OCRの性能は飛躍的に進歩しており、活字であれば99%以上の認識精度が当然の時代です。
しかし、荒っぽい手書きや半角カタカナ、つぶれた文字などの精度は下がってしまいます。活字についても、99%の精度なら100文字に1文字は誤読している可能性があるわけです。
チェックは必要になるとして、マスタ情報や辞書登録のように、元となる情報を参照して認識結果を補正する、といった機能があれば精度の向上が期待できるでしょう。
前処理機能:書類の傾き、ずれの補正
例えばFAXで受け取る注文書を例に考えてみましょう。相手先の送り方一つで傾いたり、ずれたり、そもそも90度や180度回転しているものもあります。
正方向でなくとも文字認識できるのか、補正する機能がついているのか、といった点は、最終的なデータの正確性に直結するため、確認が必須です。
自社マスタとの連携:変換、名寄せ、辞書登録、正規化
単に紙に書いてある通りのデータ化が出来ればそれでよし、というところは少ないのではないでしょうか。
例えば、同じ商品でも表記ゆれがある場合、そのままだと検索性が悪いですし、システムに連携することを考えるのであれば、品番に書き換えるという作業が発生するでしょう。
こういった課題を解決するため、想定される表記ゆれを登録したり、マスタと連携できる機能があるツールだと便利です。
システムとの連携:API、RPA
システムに登録、Excel台帳に転記といったデータ化後の処理を行える機能があれば、さらに業務の自動化幅も広くなりますので用途によってはあればなおよしでしょう。
設定と保守の担当範囲
上記の設定を自社で自由に行うのか、それともOCRメーカー側が行うのか、というところにも注目すべきでしょう。
内製化して自社の財産にしたいという場合は自社で設定するタイプを、効果を生むまでに時間をかけていられない、予算が十分に取れているという場合はOCRメーカー側が設定するタイプを選ぶとよいでしょう。
また、導入支援などで設定の伴走サービス、設定の代行などを行っているところであれば、徐々に内製化していくこともできます。
OCRの安全性、セキュリティで比較
導入するにあたり、気にされる方も多いのではないでしょうか。少し前までは「クラウド経由は危険」という意見が主流でしたが、昨今そういった懸念を払拭すべく、クラウドサービスも手を尽くしているようです。
オンプレミス
最も安全といえばオンプレミス型でしょう。外部漏洩はありません。
ただし、サーバーの管理・維持に莫大な費用が掛かる、アップデートのたびに料金がかかる、といったデメリットもあります。
クラウドサービス
クラウド上で動くOCRサービスが増えています。初期費用を抑えて導入できます。機能追加、改善などのアップデートも随時更新されます。
ただし、会社の外に帳票をアップロードするため、画像や認識結果のデータが漏洩するリスクが付きまといます。
学習機能の有無、データの取り扱い
一見すると、学習機能があることは、認識精度を勝手に高められるため、便利です。
ただ、これも元の画像や認識結果を蓄積する機能とも取れるため、漏洩リスクを考えるうえではデメリットと裏表の機能です。

なににどれくらい費用がかかる?料金体系で比較
初期費用
利用開始時、OCRの設定費用やサーバー設置費用など、初期費用として必要となることがあります。
ランニングコスト
文字認識する項目数や文字数、枚数によって料金がかかる仕組みが一般的です。
文字認識したい書類の項目数や月間枚数などを洗い出すところから始めましょう。

いろんな意味で「使える」OCRツールの例:AI JIMY Paperbot
ここまで、設定、機能、セキュリティという観点でツールを比較するポイントや注意点を見てきました。最後に、OCRの中でも汎用的で単なるデータ化にとどまらず、自動化の幅が広いものを一つ、ご紹介します。
定型・非定型帳票に合わせて選べる文字認識方法
領域指定、項目抽出、どちらも搭載されているので定型帳票、非定型帳票いずれにも対応できます。
領域指定なら書類ごとにテンプレートを、項目抽出ならデータ化したい項目名と指示文を設定します。
高精度、高機能、文字認識前後の連携も可能
認識精度の高さに加えて、登録されたマスタを参照して、名寄せや変換が可能です。紙に書いてある通りに文字認識するだけでなく、その後のシステム連携にあわせてデータ化することができます。
- 「おいしいリンゴ」「おいしい-リンゴ」は全て「おいしい リンゴ」に表記統一
- 「おいしい リンゴ」は「101」、「甘い ミカン」は「102」
また、文字認識する書類の自動取り込みやRPAによるExcel転記やマクロの実行なども可能であるため、自動化の幅が広くいのも魅力の一つです。
マスク処理による情報保護
文字認識エンジンはクラウド上にありますが、認識結果を返した後は直ちに画像データ、文字認識結果をサーバ上から削除されるため、外部漏洩のリスクは低いといえます。
また、外部サーバに送られる前に個人情報などを塗りつぶす機能を備えているため、個人情報など漏洩しないよう設定することができます。

まとめ
今回は、AI OCR製品の比較選定ポイントを紹介しました。活用シーンによって必要、不要、あった方が便利な機能が異なります。
- 文字認識の方式:対象の帳票、どの情報をデータ化したいか
- 機能:認識結果の補正や変換は必要か
- セキュリティ:取り扱う帳票の機密性・保護の必要性
- 費用:処理する枚数、一枚当たりの項目数
上記のような観点から自社の業務改善に最適なOCRを見つけてみてください。

