【RPACommunity 特別イベント】2022年10月13日 AI OCR勉強会

 2022年10月13日に RPACommunity 主催で 【特別イベント】AI OCR勉強会~最新情報・実演・AIエンジニアトーク~が行われました。AI OCRの最新事情から弊社最新AI OCR製品「AI JIMY Paperbot」のご紹介・実際のデモ動画・弊社開発者によるライトニングトークなど様々な内容をお話がありました。今回は、AI OCR勉強会の様子をレポートいたします。

目次

アジェンダ

タイムテーブル

時間内容登壇者
19:00オンライン開放
19:30イベント開始
オープニング:RPACommunity最新情報Mitzさん
AI OCR 最新事情!シー・システム株式会社 :森下
AI OCR ライトニングトーク
なぜAI JIMY Paperbotが注目され始めたのか?
シー・システム株式会社 :森下
AI OCR ライブデモ
初公開!AI JIMY Paperbotの実演します。
シー・システム株式会社 開発:田方
QAタイム
AI OCR ライトニングトーク
AI開発者トーク
シー・システム株式会社 開発:佐藤
AI OCRクイズ
クロージング
21:00終了

当日の振り返り

AI OCR 最新事情!

AI OCRの最新事情として、OCRの社会背景や導入実態、そして全企業が直面している社会動向について話がありました。まだまだ活躍のシーンが期待されるOCRですが、課題が残っていることも事実です。今後のAI OCRにも注目です。

AI OCR ライトニングトーク ~なぜAI JIMY Paperbotが注目され始めたのか?~

AI OCRのツールがいくつか出てきている中で、なぜAI JIMY Paperbotが注目を浴び始めたのかについて話がありました。

AI OCRツールにRPA機能が加わることで、データ入力業務のプロセス自体を自動化できるようになりました。また、改正された電子帳簿保存法の保存要件に対応できるツールとして紹介がありました。

AI OCR ライブデモ ~初公開!AI JIMY Paperbotの実演~

 AI JIMY Paperbotの実演動画の紹介がありました。帳票の仕分けや文字認識などの標準機能からExcelやシステムへの転記、事前に行う設定方法までを次の動画で紹介しております。

AI OCR ライトニングトーク ~AI開発者トーク~

 AI開発者より、AIが文字をどのように学習し、どのように認識しているかに関する説明がありました。また、開発者の視点から、実際に日本語OCRのモデルを作成するにあたって苦労した点や工夫した箇所についての話がありました。

当日QAに対する回答

 イベント中に頂きましたご質問の内容を掲載させていただきます(質問順(順不同))。

カラムに分かれた読み取りはできるのかしら……(Twitterより)

現時点では、テンプレート上に、各読み取り個所を配置する必要があります。表であれば、すべてのセルを読み取り項目として設定する必要があります(将来的に、表の読み取りを簡単に出来るような機能の実装を検討しています)

エンジン、LINEのを選んだ理由も気になるね

シンプルに認識精度の高さと認識速度が決め手となりました

AIについて、すごく分かりやすかった

そう言っていただけてうれしいです。また、AIについてお話しできればと思います

社内ではモリシーは怖いの?

顧客満足を優先するがために、頑固なところがあるかと思います(部下談)

AIエンジニアは高給取?

ご想像にお任せします。挑戦されてみますか?

項目単位でなく、ページ単位でこの値段?? でしたらかなりお安いですね

ありがとうございます
はい、ページ単位なので、項目が多ければ多いほどお得です

DXsuiteって項目ごとに3円じゃなかったっけ?1ページに100項目あったら300円?

恐れ入りますがお答えしかねます。他社様のWEBページなどをご参照願います

読み取り単価で考えたらDXsuiteとかよりも全然安くなりますね?

AI JIMY Paperbotはページ単位で消費しますので、項目数が多ければ多いほど領域当たりの読み取り単価はお得です。

昔やったハンズオン企画してーーー(Zoomチャットより)

是非やりましょう!

料金体系見ました。DX-Suiteより少しお高い印象はありますが…
上限枚数を超えた場合、1枚あたり何円かかかりますか?それとも取込ができなくなりますか?

詳細は、料金プランページの追加オプション欄を参照ください
https://aijimy.com/ajp-plan/

モニターは何名まで??

一旦、上限は10名で考えていますが、ご希望に沿って変更していきたいと思います

画面の解像度なんかで読取位置がずれたりはしないの??(Zoomチャットより)

画面の解像度が異なっても、読み取り位置はずれません
RPA機能で画面をクリックする時は、影響します

人が通帳をA4紙にコピーしたものをPDFにした場合、ページごとに位置にずれが発生してしまいますが、そういった読取は難しいでしょうか?

傾き補正、位置補正を行いますが、大きく「ずれ」が生じた時は、読み取りが難しい場合もあります

セキュリティを担保するようなオプション(IP限定、ipsec等)はありますか?

特段、ネットワーク上制限をかけるオプションは準備していませんが、もしご要望がありましたらぜひ検討します

RPAとAPI連携できますか?

現在API連携はありませんが、ご要望が多ければ検討します

個人情報の部分を矩形選択で除外してアップロードすることはできますか?

現在この機能はありませんが、ご要望が多ければ検討します

トライアルして出来たことなどをブログに書いてもいいですか?

ぜひ書いてください!

料金体系を教えて下さい

料金プランのページを参照願います
https://aijimy.com/ajp-plan/

読取る帳票のテンプレートは何種類くらい保存できるのでしょうか

一度に読み取る枚数と、ひとつのワークフローに含むテンプレートの種類は、トレードオフの関係になります
アプリケーション的に制限をかけていませんが、あまりに多いと、メモリが足りなくなることがあります
テンプレートが100枚を超えて動作する実績があります

取り込みしたファイル(pdf, jpg, tiff, pngなど)と原紙は保存されているのですか?(Zoomチャットより)

スキャン対象の元帳票は、削除しません

ブラウザへの入力でオブジェクト等の指定が出来ないと説明していたと思いますが、座標指定のみでの指定ということでしょうか?

マウスクリックは、座標指定のみです
アプリケーションへの入力は、Sendkeysを利用します
Excelは、セル指定を行います

AI OCRって 文字認識をCNN 文章認識をRNNでやるの??(Twitterより)

認識手法にも様々なものがあるため一概にそうだというわけではありません
ご質問にある通りCNNで文字情報を系列情報として取り出し、その系列情報を使ってRNNで予測させるという手法もございます

LINE等で撮影したら自動で認識してCSV化してくれて、PowerAutomateとかと連携してくれたら、楽そうだなぁー と言ってみるw(Zoomチャットより)

LINE Developerでチャンネル作成して、Messaging APIとCLOVAのAPIをPower Automateのフローに組み込めば、作れそうだなぁーと思ってみました

RPA部分はオリジナル?さらにRPA部分は進化していく感じですか?

RPA部分はオリジナルです
今後の機能追加を検討しています

何件以上であれば、人力よりもアドバンテージが得られるか。。。。(Zoomチャットより)

労働時間だけで単純計算を一例でしてみたいと思います
———–
例)データ入力時間 60秒/枚 × 処理数 2000枚/月 × 人件費 2000円/時間
→ 月間6万6千円
———–
もちろん、採用費用や社会保険料などの人件費、人的ミスによるロスなど考慮する必要はあるかもしれません

縦書きも?!某AI OCRは未対応じゃなかったかな…?(Zoomチャットより)

エンジンとしてのLINE CLOVA自体は縦書きも読み取ります
当該アプリケーションは、横書きを想定しています
縦書きは保証外ですが、読み取れるようです

他のRPAでもOCRエンジンが搭載されてますよね?たしかAAとかUiPathなんかもですよね。。それよりもAI Jimyはすごいの??(Zoomチャットより)

一番異なるポイントとしては、データ入力業務特化型ですので、シナリオ設計やAPIで連携するなどのRPA開発をする必要がない点です
加えて、ツール代も比較的安価で利用できます

名前の由来は??

事務作業にAIを組み込むのでAI JIMYです
「ジミーちゃん」と呼ばれると喜びます

AI OCRで成功している中小企業事例ってありますでしょうか?きになる~

弊社事例でしたらございます
可能な範囲で共有していきます

どんな導入のハードルがありますか?(Zoomチャットより)

例えば、請求書を読み取りたいと思ったとき、すべての請求書の様式をテンプレート化しようとすると大変です
枚数の多いものを自動化し、数の少ないものは従来通り手作業で処理するなど、100%自動化を目指さない方が導入しやすいです

ここが自慢!ここが苦手!も生々しく聞きたいです

出力ファイルの名前を認識結果から自動でつけることができたり、簡易ではありますがRPA機能とOCR機能を1つにしているので連携のしやすさや自慢でしょうか
苦手なところは、傾いている帳票の読み取りですね

本製品でしかできないことってありますか?

データ入力業務に特化しているため、スキャンから仕分け、AI OCR、データ出力、データ入力用のRPA機能が一つのツールとして利用できる製品は本製品のみだと自負しています

認識精度を上げるためには何をするのが効果的でしょうか?

大きめの文字がよいです
読み取りたい項目が数珠つなぎになっているものは、苦手です

実演、ぜひZOOMホワイトボードでその場でやってもらいたい!できますか?

準備できてなくてごめんなさい
次回やりましょう!

FAX受注データをAI OCRにて読み取りしたいのですが、紙の上下の判別も可能なのでしょうか?

自動での帳票の回転は行いません。スキャン時に手動で回転させることができます

撮影機器はどんなものをどんな基準で選べばよいか教えていただけますでしょうか

縦or横幅が 1,280px以上の解像度が必要
オートフォーカス推奨
照明付きが便利
脚付きが扱いやすい

AI OCRのデモではよく申込書のような部分的なOCRを目にするが、論文のような長文かつ紙全体に渡るOCRはできるのでしょうか?

可能です

オンプレ環境で行うことは可能か?セキュリティは大丈夫か?

文字認識はクラウド上のLINE CLOVAを利用します。
LINE CLOVAでは、データを保存せず、学習の教材にも利用していないとのことで

文字認識は100%正確にできないため、読み込み後に人が確認作業を行っているかと思います
この確認作業は読み込んだ文字を眺めるような作業で行っているなど、どのような方法で行っているのか知りたいです

目視チェック、画面で修正…枚数が少ない時
Excelや別システムに登録後に修正…登録後でも可能な時
複数のAI OCRのコンペ…大量処理時
読み取り内容同士の照合・答え合わせ…エラーチェックのみ

ついにモリシーところAI-OCRお披露目ですね
おめでとう

ありがとうございます
これからよりお役にたてるようブラッシュアップもしていきたいと思います

RPAとOCRを組み合わせて利用する方法はありますか?

PaperbotのRPA機能を利用できます
他RPAからの呼び出し実績があります(例:Power Automate)

AI OCRのような字形を学習させるOCRでは一定以上の精度が出ないと思うのですが実務で利用されている方は校正はどうなさっているのでしょうか?

目視チェック、画面で修正…枚数が少ない時
Excelや別システムに登録後に修正…登録後でも可能な時
複数のAI OCRのコンペ…大量処理時
読み取り内容同士の照合・答え合わせ…エラーチェックのみ

なぜ、AIOCRの製品を出そうと思ったんですか?

AI OCRに関して企業様から多くの要望をいただいてきたのですが、なかなか費用対効果のでるご提案ができなかったことをきっかけに、自社で開発を開始しました

読み取れる漢字を教えてください。例えばJIS第2水準とか

数字、アルファベット、ひらがな、カタカナ、記号、JIS第1水準(2965字)とJIS第2水準(3390字)の漢字 を読み取ることができます

まとめと今後の予定

 今回は、RPACommunity主催で AI OCR勉強会がありました。今後も、今回のようなAI OCRのイベントがあるかもしれません。その際は、ぜひ一度ご参加してみてはいかがでしょうか。

ajp_banner

この記事が気に入ったら
いいね または フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次