【RPACommunity 特別イベント】ここが聞きたいAI OCRの真実-Q&A- 2022年12月15日

2022年12月15日RPACommunity 主催で【特別イベント】ここが聞きたいAI OCRの真実~リアルタイム実演あり~が行われました。LINE株式会社林さんによるAI OCRの実情や住化農業資材株式会社の長村さんによる現場での導入体験といった貴重なお話を伺うことができました。本記事は、イベント時に回答しきれなかったQ&Aについて掲載しています。

目次

タイムテーブル&ダイジェスト

時間 内容 登壇者
19:00 オンライン開放 本編開始までITネタでフリートーク
19:30 イベント開始
オープニング:RPACommunity最新情報 運営
OCR 勉強会 LINE株式会社
林 将史さん
AI OCRユーザーぶっちゃけトーク
・導入背景、導入業務の事例、導入後について
シー・システム株式会社
LINE株式会社
住化農業資材株式会社
認識精度チャレンジ シー・システム株式会社
森下 亮佑さん
佐藤 孝明さん
QAタイム
実演も交えながら
クロージング
21:00 終了

ダイジェスト動画はこちらから
↓↓↓↓↓

Q&A

AI OCRを取り巻く環境など

回答者
 【長村】→ 住化農業資材株式会社 長村(利用者)
 【林】→ LINE株式会社(AI OCRエンジン開発) 林
 【シー】→ シー・システム株式会社(AI OCRシステム開発)
※敬称略、順不同

Q. 紙帳票を電子データで送る、請求書ならクラウドでやるとかペーパーレス・電子化が先決では?

A. 本質的に目指すべき先として私どもも同意です。一方で、業界特性や取引先の意向もあり、1社単体の意向ではEDI化や電子化が進めにくい実情があります。そういった業界/状況に身を置く企業様が効率化を進められるようお手伝いをしたいと思っています。【林】

Q. 日本は紙・印鑑文化だけど、欧米はまた違うのではないかと思います。日本特有の課題はありますか?

A. 日本語は文字種が多いため、アルファベットだけの欧米に比べ、読み取りが困難です。タイプライタやPDFの利用が多い欧米に比べ、(くせ字になりやすい)手書きや、(ノイズの入る)FAXが多用されるため、さらに読み取りが困難です。【シー】


日本より電子化が進んでおり、紙も少ないですが、欧米でもPDF等のデータはまだ多くあり、そこにAI OCRは活用されているようです【林】

Q. AI OCRは複数社から製品が出ていますが、他製品の動向について教えてください

A. 上位製品では、読み取り精度は数%の違いとなってきました。各社技術向上の方針はもちろん同じですが、注力業界や連携サービスに特徴がで始めています。また精度についても得意領域の違いがあるので、今後はそれぞれの特徴を強めていく方向に進むと思います【林】

Q. AI OCRと汎用OCR(従来のOCR)のシェアはどうなのでしょう?これからはすべてがAI OCRになるのではないでしょうか?

A. ある調査によるとOCR市場のうちのAI OCR の比率は、まだ全体の1/3程度で、年々規模を増やしてきていますが、まだまだ汎用OCRの方が強いです。汎用OCRは歴史も古く、郵便番号の読み取りなどが古い事例としてあります。処理にそこまで大きなリソースを求めない良さもあるため、直近でなくなることはないと思います。AI OCRはこれまで精度面でOCRが手を出せなかった分野で特に利用されています【林】

Q. ツールの導入より、現業とどう連携できるかなのではないでしょうか?

A. 完全に同意です。OCR単体の導入で効果を出すケースも多くありますが、データ入力業務だけでなく、関連業務全体の効率化を目的に、既存システムとの連携などを前提に、検討頂くことが重要です。【林】

Q. 導入に踏み込まない企業が多いと思いますが、LINEさんはどういうメッセージでマーケット拡大に向けて推進されていますか?

A. 中々踏み込めない要因は、サービス提供社側にあると考えてます。それがプロダクトの精度や利便性であったり、導入効果を正しく伝えきれていなかったりなど複数あります。課題が深刻にも関わらず、OCRを含んだ自働化された仕組みの導入を進められていない企業様に対しては、「あ、これなら使える」と思って頂けるようなサービスを目指しています。これは、企業様に対してもそうですし、企業の業務改善を担うベンダー様に対してもお伝えしていきたいメッセージです。【林】

Q. LINEさんのAI関連の部署はどのくらいの規模なのでしょうか?

A. 150人ぐらいで、多くが技術者です。AI OCRだけでなく、Chatbot、音声認識、感情分析など、各種AI分野の開発を行っています【林】

Q. LINEさんとシーシステムさんの棲み分けはどうされていますか?

A. LINECLOVAは文字認識に特化し、AI JIMYは、RPA等も含まれ業務全体の課題解決に特化した役割分担になります。【林】

Q. AI JIMYの、意外だなと感じた利用先があれば教えていただきたいです。

A. 意外、というわけではないのですが、チェックボックスの精度を評価いただき、問診票の読み取り用として、病院での利用がありました。【シー】

Q. AIOCRって、読み取り枚数単位なのか文字数単位なのかで基本料よりも結構費用がかかるイメージです。

A. 製品により価格体系は様々です。AI JIMYはページ単位での料金体系なので、項目単位での料金体系の製品に比べ、明細行を読む、勤務記録を読むなど、項目数の多い帳票で、ご利用いただきやすい製品になっています【シー】

Q. 枚数課金で結果的にどれくらいの価格になるのかも気になります。

A. 例えば、Standardプランであれば、月に2,000枚が上限で、5万円/月(年契約)になります。プランにより枚数や機能に制限がありますので、以下のURLをご参照願います。【シー】
https://aijimy.com/ajp-plan/

読み取り精度と校正について

Q. 精度を100%に出来ないので…AI OCRは精度が100%にならないので、人によるチェックをなくせず効果が出せないです。チェックが不要な分、外部委託した方がトータルで安いのではないかと思います。

A. あるデータ入力会社さんでは、複数名で入力して突き合わせる運用から、1名をAI OCRに置き換えることで、コストの削減を図られているようです。また、複数のAI OCRを導入し、突き合わせを行うことで、チェック工数を削減している金融機関があるそうです。【シー】

Q. 精度が100%に出来なくても…80%ぐらいの精度でも、チェックのしやすさの方が大事だと思います。1ページ単位ではなく、項目単位で串刺しに出来ると嬉しいです。認識結果の確認や修正を効率的に行う方法を知りたいです。

A. おっしゃる通り、操作のしやすさは大切だと認識していまして、項目単位での串刺し、検討させていただきます。

数字を扱う時は、チェックデジットや計算をうまく利用して、読み取り、計算間違いを見つけ出す運用をされているところもあります。【シー】

Q. 自然言語解析かけないと字形だけでは精度頭打ちですよね?

A. 文字単位ではなく単語単位で学習を行っていますが、まだ足りないところがあると認識しています。今後必要になると認識しています【林】

Q. 製品により、AIの認識に自信があるかないかで色分けされて、人によるチェックもAIが自信が無いものだけに絞ったりできる機能がありますが、AI JIMYにはそのような機能もありますでしょうか?

A. 一定の認識精度が下回る時は、読み取り結果欄に、黄色の「!」マークを表示しています!マークのついた項目のみを抜き出す機能はありませんが、検討したいと思います。【シー】

Q. AIなので間違って読み取った文字を学習して、より正解に近づけていくと思うのですが、それによって認識できるようになるまでの学習時間(期間)ってどれくらいですか?

A. お客様のデータを用いた学習は行なっておらず、弊社で用意したデータを用いて精度改善の学習を定期的に行なっております。年に数回の頻度でアップデートを行なっております。【林】

セキュリティについて

Q. 個人情報が含まれていて、クラウドに置きたくないのですが、何か対策はありますか?

A. LINE CLOVAは国内サーバで、画像も読み取りデータも即削除します【林】

読み取り対象でなければ、AI JIMYではマスク機能があります。マスクした箇所はAI JIMYで塗りつぶしを行うので、クラウドに配置されません。【シー】

技術面について

Q. AI OCRって文字以外にも読めるんですか?

A. 製品により様々ですが、AI JIMYの場合、文字に加え、バーコード、QRコード、チェックボックスを認識します。【シー】

Q. LINEさんのこの精度をそのままシーシステムさんのアプリで実現できるということですか?

A. 文字認識の精度に関しては、LINE CLOVAの性能そのままです。文字の切り出しなどで、AI JIMY独自の調整を行っています。また、チェックボックス、バーコードは、AI JIMY独自の認識エンジンを利用しています。【シー】

Q. AI JIMY と連携し易いSaaSとかアプリを教えてください。

A. API連携機能は特にありませんが、一般的なRPAツールとの連携を行うことは可能です。【シー】

テンプレートについて

Q. 認識率をあげるため、設定した位置のズレが少ないって大事だと思うのですが、枠がある帳票の方がズレ補正が効きやすいなど、テクニックはありますか?

A. テンプレートと読み取り帳票は、同じ環境で読み取ってください。例えば、EXCELで帳票を作成した時、エクスポート機能でPDFを作成するのではなく、印刷し、帳票を読み込ませるスキャナで読み込んでからテンプレートを作成すると、より補正が効きやすくなります。自動仕分けを行う時は、「似ている」「似ていない」で仕分けるため、できるだけ個性的なデザインを推奨します。【シー】

Q. 先方からの領収書などはこちらで様式を指定できませんが、アンケートなどこちらで様式を作れるものはAI OCRとの相性がよい様式にするのが大事だと思っています。別製品ですが帳票設定のクセとか何度も試して調べたことがありますが、ある程度コツを開示してほしいです。

A. 文字の大きさや太さ、欄の有無、チェックボックスなどのデザインなど、かなり多岐に渡りますので、別途ご相談いただけたらと思います。【シー】

ご要望

Q. OCRを試してみたことがありますが、イチとエル、ゼロとオーの判別などに苦しんで断念したことがあります。設定する項目が数値項目なのか、文字列なのか、住所なのか、日付なのか、時間なのか…みたいな項目の型が設定できると嬉しいです。

A. AI JIMYの場合、RPA機能で、認識結果の文字の置き換えを行うことができます。項目の型指定は、製品により様々ですが、AI JIMYにはありません。検討したいと思います。【シー】

Q. 帳票設定のしやすさも気になります。コピペがほしいです。一行分の設定したらそれをコピペして何行分にでも展開できると嬉しいです。項目を並べるのは目が疲れます。

A. 検討したいと思います。【シー】

Q. チェックボックスの出力の文言は自分で設定したいです。true/falseではなく、男・女 など。

A. 検討したいと思います。【シー】

AI JIMY のユーザに質問

Q. どうしてAIOCR入れようと思ったのでしょうか?

A. 請求書を受け取り、各部門への賦課を行う業務に手を取られていたので、自動化したいと思っていました。【長村】

Q. トップの理解はどうだったのでしょうか?

A. 社長はIT化に関心があり、理解を示してくれました。【長村】

Q. どこと比較検討して、何故AI JIMYを採用したのですか?

A. AI JIMY OCR(旧製品)は試用期間が長かったため、充分に検証を行うことが出来ました。ページ単位の料金体系なので、項目数の多い帳票の読み取りが有利でした。【長村】

Q. 今、元は取れていますか?

A. 他AI OCRに比べて安いのですが、先日算出したところ、残念ながら現時点では元が取れていません。請求書の自動化でやり方がわかったので、他の帳票でも似たようなことが出来るのではないかと検討中です。【長村】

Q. 何と何を連携してどう活用しているのか、今度社内システムの概要図とか業務フローとかも合わせて、ぜひ登壇していただきたいと思います。

A. もし需要があるようでしたら、忌憚なくお話しさせていただきます。【長村】

AI JIMY のユーザに、認識精度や使い勝手での要望があればお尋ねしたいです

Q. 例えば、トリケシ線「100 50」 と書かれていた時、「10050」と読み取ってしまう。仕方がないと思っていて、様式を変更するなどで対応しています。

A. 塗りつぶせば(■■50など)消える(可能性が高い)のですが、消し線は難しいです。運用で回避いただけると助かります【シー】

Q. 濁音(「バ」など)、半濁音(「パ」など)の区別が弱いです。RPA側で置き換えて、対応しています。

A. ご指摘いただいた内容は、ちょうど検討課題、改善中になっています。シー・システム経由でデータをいただけたらと思います。【林】

Q. テンプレートで、項目の型が設定出来れば、同じ領域を別の設定で重ねて読み取ることで、確認がしやすくなります。

A. 検討したいと思います。【シー】

まとめ

今回はAI OCRを提供しているLINE株式会社による解説やAI JIMY Paperbotの機能や実際に使用・活用している住化農業資材株式会社の率直なご意見や貴重なお話を伺いました。このほかにも相談や疑問があるかと思います。今後もぜひ交流を続けてみてください。

AI JIMY Paperbot Banner

この記事が気に入ったら
いいね または フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次