ペーパーレスの一環として、紙文書をデータ化する企業が増えているようです。しかし、ただスキャンして画像化するだけでは、ファイル検索がしづらいといった問題があります。素早く検索するには、画像内の文書もデータとして認識させておかなければなりません。この記事では、文字をデータ化する際に使用するOCRの注意点や用途について紹介していますので、ぜひ参考にしてみてください。
OCRで読取りにくい文字や状況
OCRは、Optical Character Recognitionの略で光学文字認識のことです。紙の書類を画像としてパソコンなどに取り込み、画像内の文字をデータとして編集できるようにします。
便利なOCRですが、間違って読み取ることも多く修正に余計な時間を割いているという話も少なくありません。どういったフォントや状況が読み取りにくいのか見ていきましょう。
原稿の紙が薄く下の文字が透けている
人の目では認識できるような文字もOCRでは認識が難しいものもあります。紙が薄く下の文字が浮き出してしまっているような場合、下の文字まで読取り範囲と認識し間違ってしまいます。画像にしたとき下の文字が透けてしまっている場合は、スキャン時に白紙などを敷いて読み取ると改善されることも多いようです。
汚れやノイズなどが入っている
FAXの文書などでは、画質が悪く黒い線やトナー汚れが付くといったことがあります。この状態の文書ではOCRが読取りを誤ってしまうことがあるため、定期的なメンテナンスを行うといった方法で良い画質を維持するのがおススメです。
解像度の低い画像
文字が小さく画像を拡大してもつぶれて読みにくいような場合は、OCRを使用しても読取りが難しいでしょう。スキャナや画像の用途により、解像度を低く設定しているのかもしれませんが、OCRを使用したいときは300~400dpiはほしいところです。
縦書きと横書きが混在している文書
紙ではなく文字が斜めになっていたり、1枚の文書に縦書きと横書きが使用されたりしていると文字を認識できない場合があります。必要なときは、読取り箇所を選択できる形式のソフトなどで解決する場合があるかもしれません。どうしても書式が混在する文書をデータ化しておきたい場合は、読み取り内容を修正していくといったひと手間がかかることを覚えておきましょう。
AI OCRで解決できる文書
通常のOCRのみでは読み取りが難しい文書でも、AI OCRであれば下記のような場合は正確に読み取ってくれます。
- 請求印や社印などが重なっている文字
- 傾いた状態でスキャンされた画像
- 網掛け書式が使用されている文章
- 手書きでも読取り精度が高い
- チェックやマークの識別も可能
たとえば手書きアンケート場合、これまでは専用ソフトでチェック箇所を読み取ることができても自由記述の内容は手入力で別途打ち込む必要がありました。AI OCRであれば、チェックと自由記述のデータ化を一度に済ませられます。AI OCRはすでにGoogleドライブやiPhoneの写真でも利用できるなど、生活の中に取り入れられています。
業種別OCRでできるデータ化の事例
OCRが苦手とすることがわかったらぜひ、業務にも取り入れたいところです。ここからは、業種別にどのようなシーンでOCRが取り入れられるか一部例を見ていきましょう。
医療関連:初診票を取込みデータ化
初めて訪れるクリニックでは手書き問診票が多く、事務で入力作業をおこなってデータ化するところも少なくありません。問診票をスキャンして、読み取ったデータを既存システムの必要個所に入れられるとかなりの労力が削減されます。
運送業:受発注伝票の処理
運送業に限ったことではありませんが、FAXやメールで来る受発注伝票。ある企業では受発注伝票の転記作業だけで、毎日5時間パートを雇って行っていたという例もあります。このような受注伝票はOCRを搭載しているシステムに読み取らせるだけで、転記作業による人的なミスも大幅に削減可能です。
製造業:検品報告書のデータ化
製造業で欠かせない検品作業。報告書はすぐにPCへ打ち込むことができれば良いが、大型のものはそうはいかない場合もあります。もちろん、最近ではタブレット端末を使用して行う企業もありますが、導入が難しい場合は検品表をOCRでデータ化するのも良いかもしれません。読み取ったデータは製造番号ごとに管理すれば、検品データの抽出も行いやすいのではないでしょうか。
AI OCRを一度試してみたいと思ったらAI JIMY Paperbotがおススメ
業務効率化にOCRを初めて検討する方や少ない予算で始めたい方はAI JIMY Paperbotがおすすめです。
手書き文字にも対応のAI OCRを使用しており、世界最高水準の文字認識率を達成しています。また、文字認識した結果をExcelや個別の管理システムへ自動入力ができるRPAも搭載しています。データ入力やリネームの作業のための機能が数多く搭載しています。このツール一つで業務の自動化が実現化が可能です。
無料トライアルを行っているので、気になる方は試してみてはいかがでしょうか。
AI JIMY Paperbotを利用するメリット
OCRに生成AIとRPAを搭載 一つのツールでデータ入力作業を完結
画像の取り込みから取引先ごとの仕分け、手書き文字の認識、テキストデータの出力、業務システムへのデータ入力まで、一連の作業をAI JIMY Paperbotひとつで自動化できます。
無料で誰でもカンタンに使用可能
AI JIMY Paperbotは特別な技術知識は不要で、マウスだけの直感的な操作が可能です。RPAツールとの連携や専門知識が必要なAPIなどの開発作業は必要ありません。無料で利用開始できますので、カンタンに試すことができます。
自動でファイル名を変換できるリネーム機能
リアルタイム処理を行い、任意で電子帳簿保存法の改正にも対応したファイル名に自動で変換可能です。
AI類似変換で社内のマスタと連携し、文字認識が向上
日本語の認識は、手書きも含めてかなり高い精度で変換できます。間違いやすい商品名などの固有名詞は、あらかじめAI JIMY Paperbotに登録しておくことでさらに認識率が向上します。
多様な業務で活用
さまざまな業務で使用が可能です。FAXの受注入力、請求書の集計、手書きアンケートや申込書のデータ入力、作業日報のデジタルデータ化など多岐にわたる業務プロセスをサポートします。
まとめ
OCRの読み取り精度に関するポイントと業種別の利用例を紹介しました。OCRはAIと連携したことで、数年前の業務に使えないイメージから大きく変わっています。この記事で紹介した以外にも、文字とバーコードも同じシステムで読めるようになったため、それぞれ専用のシステムを必要としなくなり、導入コストが下がり始めています。また、フォーマットを問わないなど自由度も高いため、データ化のハードルは低くなっているようです。自社の場合はどうだろう?といった疑問は、資料をたくさん集めて比べるよりも担当者に直接聞くと良い案が出るかもしれないので、ぜひいろいろと確認してみてください。