画像から文字データを取り出し、PCなどで編集できるようにする機能「OCR」をご存じでしょうか。PCやスキャナが一般的に普及したころからある技術ですが、業務への活用となるとまだまだ利用されている企業は少ないようです。しかし、昨今のAI技術と組み合わされたAI OCRは、さらに使い勝手の良いものに進化しています。OCRの仕組みや業務への活かし方を理解するととても便利で、効率的に業務を行えるようになるかもしれません。この記事では、OCRの仕組みを解説し、利用できるサービスや導入事例を紹介しています。
OCRとは
OCRは日本語で光学的文字認識のことでOptical Character Recognitionを略した呼び方です。手書きや紙に印刷された書類をスキャナーやカメラでPCで取り込むだけでは、書かれている内容の編集はできません。取り込んだ書類の文字情報をPCで編集できるようなデータに変換してくれる技術がOCRです。
通常は人が目で見てPCへ打ち直す必要がありますが、OCRがあれば素早くデータ化できます。データ化した書類は、文章の一部だけコピーして引用したり、修正を行ったりできてとても便利です。
文字をデータ化するOCRの仕組み
OCRはどのような仕組みで文字をデータ化しているのでしょうか。わかりやすく解説していきます。
1.画像データを取得
OCRの最初のステップは、解析対象の画像を取得することです。スキャナを使用して文書をスキャンしたり、デジタルカメラやスマートフォンで写真を撮影したりすることが含まれます。
2.読み取り結果の精度を上げるための前処理
OCRは高品質な結果を得るために、取得した画像に対して前処理を行います。画像の回転やスケーリングの補正、ノイズの除去、明暗の調整、コントラストの強調などを行って文字を識別しやすくします。
3.文字がある個所を認識
読み取る個所をブロックで認識していきます。OCRによりますが、読み取る個所は事前に手動で設定することが多いです。ブロックとして読み取った文字をさらに1行ずつ解析し、1文字ずつ読み取れるように画像として分解します。
4.文字を認識
それぞれの画像にある文字を1字ずつ認識します。文字認識は画像内の各文字を識別し、OCRが持つデータと照らし合わせてテキスト文字に変換していきます。
5.テキストとして出力
OCRは画像内のテキストを抽出して、PCが解釈できるテキストデータとして出力。これにより、デジタルデータベースに格納したり、修正などのテキスト処理を行ったりすることが可能です。
また昨今のOCRでは、文字をデータ化する前に修正を行ってくれる場合があります。あらかじめ備えられている辞書により単語や文脈を解析して、訂正をしたり単語の整形を行ったりすることで、文字の認識精度を高めています。
AI OCRで何が変わったのか
OCRは100年ほど前にドイツの研究者やアメリカで開発、特許認定され、日本では郵便番号の読取りのために導入されました。
もともとアルファベットや数字を認識するために開発されているので、日本語のような複雑な形をした文字や漢字は苦手です。従来のOCRは、開発者が文字のテンプレートを作成し、間違った読取りを行った場合でもそのテンプレートを修正するまで同様の間違いを繰り返します。
AIの技術が進み、OCRと組み合わせて使用することで飛躍的に認識精度が高くなりました。AIを活用するとテンプレートを利用した画像認識だけでなく、過去に読み取ったデータからも学習をし、柔軟に適応することができます。さらに、学習を続けることで誤ったデータを改善していくので、より高い認識精度を出せるようになっています。
またAIの技術を活用すれば、文字だけでなく文脈を学習させることが可能です。単純な認識結果だけでなく、文脈に沿った単語を選択してくれます。さらに、文字の形であるフォント、サイズやスタイルなど多くのデータを学習させれば、活字だけでなく手書き文字といったさまざまな文字を精巧に読み取れるようになるでしょう。
AI OCRを使用する上でのメリットとデメリット
便利なAI OCRですが、利用する際のメリットやデメリットも抑えておきましょう。
AI OCRを企業で利用するメリット
AI OCRを企業で利用した場合、以下のようなメリットが考えられます。
- 自動でデータを抽出し作業を高速化
- 入力ミスを軽減
- 文書の検索と整理を容易化
- 自動化によるワークフローの改善
- 作業コストを削減
- データ活用をしやすい
- アクセシビリティの向上
メリット1 自動でデータを抽出し作業を高速化
AI OCRは、紙文書や画像からテキスト情報を自動的に抽出できます。これにより、従来の手動での文字起こしやデータ入力作業の手間を省くことができ、その結果として業務の高速化と効率化が図れます。
メリット2 入力ミスを軽減
手動のデータ入力ではヒューマンエラーいわゆる入力ミスが起きる可能性が高いです。AI OCRは高い精度でテキストを抽出できるので、入力ミスや誤ったデータ作成のリスクを減らせます。
メリット3 文書の検索と整理を容易化
AI OCRによってテキスト化された文書は、Windowsやクラウドのファイルストレージなどのキーワード検索機能を活用して簡単に探せます。そのため、データの整理やアクセスが簡単に行うことが可能です。
メリット4 自動化によるワークフローの改善
AI OCRを他のシステムやプロセスと統合すれば、業務プロセスの自動化ができます。たとえば、請求書の自動処理や契約の自動抽出などが代表的です。
メリット5 作業コストを削減
AI OCRを導入すれば、従来の手作業によるデータ入力や文書管理が容易になります。そのため、それまで作業にかけていた時間や労力を短縮でき、結果的にコスト削減につながります。
メリット6 データ活用をしやすい
AI OCRによってデジタル化された文書は、データ分析の活用が可能です。テキストデータのマイニングや洞察を行うことで、より効果的な意思決定ができるようになるでしょう。
メリット7 アクセシビリティの向上
AI OCRを利用することで、印刷物や手書きの文書をデジタル形式に変換できます。変換後のデータを利用して、視覚に障がいのある方など、情報にアクセスしにくいユーザーにもアクセシビリティを提供可能です。
AI OCRを企業で利用するデメリット
AI OCRのメリットを紹介しましたが、その逆にデメリットも存在することを忘れてはいけません。ここからは、デメリットを紹介します。
- 認識精度には限界がある
- セキュリティリスクが高まる
- プライバシー問題
- 導入コストと複雑さ
- 既存システムとの統合
- トレーニングとメンテナンス
デメリット1 認識精度には限界がある
AI OCRは文字の認識精度が高いとはいえ、100%となることはありません。手書き文字も読み取れるほどの精度ですが、古い書類や複雑なフォントの場合は認識精度が低下することがあります。従来のOCRほどではありませんが、読取りミスがある場合は手動による修正が必要です。
デメリット2 セキュリティリスクが高まる
OCRの利用によってデジタル化された内容は、契約書などの機密性が高いデータも含まれる場合があります。デジタルデータのコピーは簡単に行えるため、電子データとして保管する場合は、適切なセキュリティ対策が行われていないと情報漏洩や不正アクセスのリスクが高まります。
デメリット3 プライバシーの問題
OCRは大量のテキストデータを生成できるため、申込書や会員登録時の個人情報やプライバシーに関わる情報が含まれる場合があるでしょう。機密データ同様、適切なセキュリティ対策を行うとともにGDPRなどのデータプライバシー法に適合する必要があります。
デメリット4 導入コストと複雑さ
AI OCRを導入するには、適切なソフトウェアやハードウェアの購入・設定、ユーザートレーニング、カスタマイズなどが必要です。利用したいシステムの導入コストや複雑さに対処しなければなりません。
デメリット5 既存システムとの統合
既存の業務システムとAI OCRをシームレスに統合することは、一部の企業にとって課題となる場合があります。互換性を確保するためには、適切な開発リソースと時間が必要になります。
デメリット6 トレーニングとメンテナンス
AI OCRシステムはトレーニングが必要な上に、データセットの整備や更新を行わなければなりません。また、定期的なメンテナンスやアップデートが行われないと、精度やパフォーマンスが低下する恐れがあります。
業務効率化に役立つAI OCRサービスを紹介
AI OCRを利用できるサービスは、国内でも増えてきています。ここからは、業務効率化に役立つAI OCRサービスを概要や料金、特徴などを含めて5つ紹介します。
読取りからデータ入力までこれ一つで完結 AI JIMY Paperbot
AI JIMY PaperbotはAI OCRはもちろん、指定のファイルやシステムへデータ入力を自動化するためのRPA機能も搭載しているため、読み取ったデータの自動入力までこのサービス1つで完結できます。プログラム知識が不要で直感的に操作ができるのも魅力のひとつ。無料トライアルもあるので、読取り精度や操作性を確認したうえで導入を決定しても良いでしょう。
特徴
- 紙帳票の電子化に必要な機能をすべて搭載し、プログラム知識不要で自動化を実現
- 複数帳票に対応、テンプレート登録で自動仕分けが可能
- RPA搭載なので一連作業で、読み取ったデータをExcelや既存のシステムに自動入力
料金プラン
プラン名 | 初期費用 | 月額(定額) |
Starter | 0 円 | 10,000 円 |
Standard | 0 円 | 50,000 円 |
Pro | 0 円 | 150,000 円 |
業界最高水準の文字認識精度 DX Suite
AI OCRの市場ではトップのシェアをほこります。利用する環境に応じて、クラウドやオンプレミスも選択が可能。多言語対応や帳票仕分けなど多彩な機能が利用できる。
特徴
- 手書きやFAX・写真で撮った帳票などさまざまな資料に対応
- カンタン操作で使いやすいインターフェース
- RPAやAPI連携を行うことでデータ入力の自動化が可能
料金プラン
プラン名 | 初期費用 | 月額 |
DX Suite Lite | 0円 | 30,000円~ |
DX Suite Standard | 200,000円 | 100,000円~ |
DX Suite Pro | 200,000円 | 200,000円~ |
スキャン後の文字補正はオペレーターがチェック デジパス
OCR後に必要な文字補正やチェックは、デジパスのオペレーターがすべて担当してくれるため、データ化したファイルのチェックはほぼ不要。RPAの連携や自動入力の設定もデジパス側に任せることができます。スポット利用ができる点は、書類のデータ化が常時必要ない企業には良いかもしれません。
特徴
- OCR後の文字修正や書類の仕分けといった最終作業はオペレーターが担当
- 1か月単位のスポット契約が可能
- 各種システムへの入力自動化も支援
料金プラン
プラン名 | 初期費用 | 月額 |
シンプルプラン | 0円 | 60,000円~ |
RPAプラン | 要お見積り | 要お見積り |
セキュリティ面を考えたオンプレミス環境も用意 SmartRead
独自開発のAIアルゴリズムを活用し、文字の認識率は高い精度を誇ります。AI OCRの提供だけでなく、各種アプリケーションや業務システムとの連携にも力を入れ、エンジニアのいない企業でも簡単に使えるようなサービスを提供中です。
特徴
- サービスはクラウド版とオンプレミス版が選択できる
- 文字の読取りから書類の仕分けまでAIを駆使
- APIによる各種システムやアプリケーションへの連携が可能
料金プラン
プラン名 | 初期費用 | 年額 |
スモールプラン | 0円 | 360,000円 |
スタンダードプラン | 0円 | 960,000円 |
エンタープライズプラン | 0円 | 2,400,000円 |
環境や利用方法から選べるわかりやすいプラン スマートOCR
スマートフォンアプリを連携すれば、伝票や文書の取り込みもよりスピーディに行えるでしょう。複数人で利用可能で、クラウド版とオンプレミス版を選択できるため、環境に合わせて導入できます。用途に合わせたプラン設定があるので選びやすい。
特徴
- 複数人での同時操作が可能
- 提供するスマートフォンアプリの撮影に対応
- 独自開発の文字列単位認識エンジンを用いた高精度な文字認識
プラン
プラン名 | 初期費用 | 月額 |
クラウドサービス | 100,000円~ | 30,000円~ |
専用クラウドサービス | 450,000円~ | 350,000円~ |
オンプレミス(ライセンス) | 1,000,000円~ | 100,000円~ |
業務への導入事例
AI OCRを導入すると業務の効率化につながるということはわかりましたが、実際の業務にどのように活かしているのでしょうか。ここからは、導入事例を課題とフロー、結果に分けて紹介します。
事例1 手入力の業務を自動化 金属製品製造業
課題
郵送やFAXで送付される請求書を自社の基幹システムに従業員が月の半分ほどかけて手作業で入力していた。特に月末は業務量が多く負担がかかるため、請求書のデジタル化と入力作業の自動化を考えていたところ、手ごろなAI OCRサービスを利用することにした。
改善フロー
- 郵送やFAXでくる紙ベースの請求書をPDF化し指定フォルダに保存
- 指定フォルダ内のPDFを利用しているAI OCRサービスで取引先ごとに自動仕分け
- AI OCRサービスで読み取ったデータをCSVで出力
- CSVのデータは以前より導入していたRPAを利用しAI OCRサービスと連携し基幹システムに入力
導入した結果
- 請求書の手入力にかかる業務時間が7割削減
- 転記ミスなどのヒューマンエラーが減少
- 自動化し削減できた業務時間を他の仕事に割り当てられるようになった
事例2 紙で保存していた作業日報や点検記録をデータ化 物流業
課題
ドライバーから提出される作業日報や点検記録は自社で傾向を見るために手入力でExcelに転記していた。手書きの日報や記録はドライバーによって乱雑なこともあり、入力作業に時間がかかって入力後のデータの活用もしづらかった。
改善フロー
- 記述式では内容が統一できないため、日報や点検記録の項目をチェックや丸ですませられるように見直し
- スキャナでPDF化した書類を指定フォルダへ保存
- 指定フォルダ内のPDFをAI OCRサービスを利用して、日報や点検記録などに自動仕分け
- 手書きの報告箇所のみ内容を確認し手動で修正
- 日報については、後日検索で確認できるようにタイトルを固定ルール化してPDFで保存
- 点検記録はCSVで保存し、月やドライバーごとに分析できるようにした
導入した結果
- 書類が手元に来てから転記にかかる入力作業が8割削減
- 点検記録などはドライバーの傾向分析に役立てられるようになった
- 過去の作業日報を検索する際に、日付や内容など該当キーワードで素早く探せるようになった
まとめ
AI OCRについて導入時のメリットとデメリットを含めて解説、利用できるサービスや事例などを紹介しました。利用するサービスによって、機能が多く使いこなせないかもと不安になることもあるかもしれません。提供している企業のほとんどは、抱える課題に真摯に向き合って解決できるようにしてくれるはずです。自社の運用にかかわることも多いと思いますので、ぜひ不明な点や疑問点はぶつけて業務効率化を目指してみてください。