AI OCRで手書き文字の読取り精度を試してみた!OCRとの比較も紹介

AI OCRで手書き文字の読取り精度を試してみた!OCRとの比較も紹介

PDFや画像中の文字をPCなどでデータ活用したいと思うことはないでしょうか。PDFも文字がPCでコピーできるものとできないものが存在します。そういった場合に必要なのが、OCR(Optical Character Reader/光学的文字認識)です。しかし、手書きの書類も存在するとOCRの精度が気になるところ。この記事ではスキャナーに付属している簡易OCRとAI OCRのデータ化について、実際に比較してみましたのでぜひ参考にしてみてください。

目次

OCRとAI OCRの違いは何?

画像中の文字を抜き出してデータ化するには、OCRが必要なことはご存じの方が多いでしょう。OCRは、あらかじめ登録されている文字と読み取った文字の形を比較してデータ化します。しかし日本語の場合は、多くの文字があるので文章をデータ化するのが難しく、これまでのOCRでは漢字を含むと途端に読取り精度が下がってしまいました。このように、日本語のOCRではデータ化した後も打ち直しが必要になり、かえって手間になっていたようです。

昨今では、AI OCRが利用され始め読取り精度がグンと高くなりました。AI OCRは、文字の形だけでなく前後の単語からどのように利用されているかも学習して判断できるようになっています。そのため、手書き文字にもかなりの精度で対応しているようです。

テストに使用したアプリを紹介

言葉で「AI OCRで手書きにも対応!」と言われても、どの程度の精度なのかとお思いでしょう。今回は10年ほど前に発売された家庭用インクジェット複合プリンターのスキャナー機能と無料で利用できるAI OCRを使用して、各OCRの読取り精度を検証してみます。利用したアプリやサイトについては、下記のとおりです。

  • Cannon My Image GardenのOCR
  • OneDrive
  • LINE CLOVA ※オンライン簡易利用版
  • GoogleDrive

Cannon My Image Garden

家庭用複合プリンターを購入すると利用できる「My Image Garden」。パッケージには新聞や雑誌記事などの文書もテキスト化できるなどと書いてあったが、あくまで画像取り込みが目的だったのであまり使用したことがありません。このソフトでは、PDFにすることで編集が可能。ソフトウェアはまだアップデートしていて、Windows11にも対応しています。

OneDrive

OneDrive
引用元OneDrive

Microsoftが提供するクラウドストレージですが、OCR機能も備えていて画像やPDFファイル内の文字を認識することができます。OneDriveに画像を保存後、Wordの編集機能で開くと文字の編集が行えます。無料で利用できて各デバイスからのアクセスも可能なので、外出先でスマホから文書を検索するのにも使い勝手がいいです。

▶まずは無料で試して納得!業務自動化に役立つAI OCR・生成AI・RPAを14日間体験【AI JIMY】

LINE CLOVA

参照元CLOVA OCR

LINE株式会社はAI事業にも力を入れていて、そのひとつにAI OCRがあります。パッケージとして利用できるほか、APIの提供も行っているので、ご自身で利用したりアプリ開発を行ったりできます。AI OCRの読み取り精度は世界最高クラス。ここで紹介するのは、Web上で認識できる簡易版です。本社サイトのため、韓国語となっていますが日本語の認識も可能となっています。

GoogleDrive

GoogleDrive
引用元Google Drive

GoogleDriveも個人が無料で使用できるクラウドストレージです。利用されている方も多いかと思いますが、ストレージのほかマップやEメール、officeソフトに変わるアプリケーションなどさまざまなサービスをクラウド上で提供しています。OneDriveと同様にAI OCR機能を備えているので、GoogleDriveに保存したPDFや画像をドキュメントから開くとファイル内の文字を認識して、テキスト化してくれます。

▶AI OCRとRPAが標準搭載!書類のデジタル化からデータ入力まで自動で完了!AI JIMYはこちらから

実際にOCRとAI OCRの読取り精度を比較!

テストにあたり、使用する原稿を「活字」「手書き(ていねい目)」「手書き(ややなぐり書き)」の3種類用意しました。それぞれのOCRアプリでデータ化した結果を見ていきましょう。

1.活字の読取りテスト

活字には、あえて旧漢字の入った小説の一部を利用しました。

活字見本

原稿は画像化しているので、PC上で文字の選択やコピペはできません。以下、OCRを通した結果です。

家庭用複合機
OneDrive
LINE CLOVA
Google Drive

※読み取り後のデータは、一部Wordを使用して開いているため校正機能が働いています。

古いとはいえ、家庭用複合機にバンドルされているOCRではデータ化をしてもかなりの修正が必要のようです。一部、昔流行ったギャル文字のような変換も見受けられます。活字でもこのような状況では、これまで文字のデータ化をする場合は、人が打ったほうが早いと言われてもうなずけます。

一方OneDrive、LINE CLOVA、Google DriveはAI OCRを使用しているだけあって、相当な精度です。OneDriveのところどころ濁点「゛」が抜けている個所は気になりますが、文章として読めなくはありません。LINE CLOVAとGoogleDriveに至っては、「カンダタ」という主人公の名前を除いてほぼ完璧。Wordに転記すれば画像のように校正機能が働くので、修正もそこまで大変ではなさそうです。

2.手書きの読取りテスト

手書きの読取りについては、ややていねいに書いたものと読める程度の殴り書きを用意しました。

手書き1

家庭用複合機のOCRでは手書きはほぼ読めないと思いますが、比較のためテストしてみます。

家庭用複合機
OneDrive
LINE CLOVA
GoogleDrive

家庭用複合機は、最初の方の文章がほぼ読めず「そら、」の部分がかろうじて読める程度です。また、AI OCRについても興味深い結果が出ました。私のクセで少し文章が斜め右上に向かっていたため、OneDriveでは少し読取り精度が落ちたようです。しかし、LINE CLOVAとGoogleDriveについては、こちらも完璧に読めていると言っていいのではないでしょうか。AI OCRには、傾き補正もあるのでそれが適用された形となっているようです。

3.なぐり書きの読取りテスト

手書き2

2.と同じ文章にを使用します。思ったほどなぐり書きができないのですが、崩した文字なども入れて読み取らせてみました。

家庭用複合機
OneDrive
LINE CLOVA
GoogleDrive

家庭用複合機はもはや何が書いてあるかわからないレベルです…。基本的に、手書きに対応しているわけではないので限界でしょう。OneDriveはややていねいに書かれた手書きも怪しかったのですが、やはり手書きは向いていないようです。LINE CLOVAとGoogleDriveも間違いはありますが、全く読めないというわけではありません。何より、GoogleDriveが最後の1文を間違わずに変換できたことがすごいと思います。この1文をあらかじめ学習していたかもしれません。

ここまでのまとめ:主要OCRツールの認識精度を比較

近年は多くのAI OCRサービスが登場しており、どのツールが最も自社業務に適しているのか判断が難しくなっています。ここでは、代表的なOCRツールの「活字」「丁寧な手書き」「崩した手書き」に対する認識精度を比較表にまとめました。精度の違いを視覚的に把握することで、導入判断の参考になります。

OCRツール名活字認識精度丁寧な手書き崩した手書き特徴・備考
Canon My Image Garden(旧型OCR)×
(誤認識多数)
×
(ほぼ不可)
×
(不可)
無料付属ソフト
古いアルゴリズム
OneDrive OCR
(ほぼ正確)

(一部誤認)

(判別可能だが精度低)
Microsoft製
クラウド型
LINE CLOVA OCR
(正確)

(正確)

(一部誤認)
無料トライアルあり、API利用可能
Google Drive OCR
(正確)

(正確)

(比較的高精度)
Google製、PDF変換との併用可

上記の比較から分かるように、従来型のOCRでは手書きの認識に大きな課題があります。一方で、Google DriveやLINE CLOVAのようなAI搭載型OCRは、手書き文字に対しても実用レベルの精度を発揮しています。特に「崩した手書き」の読み取りまで対応できるかが、業務活用の成否を分けるポイントです。

業務で本当に使えるOCRとは?

高精度なAI OCRが普及し、文字認識そのものは確実に進化しています。しかし、実務でのOCR活用では「読み取るだけ」ではなく、「その先の業務にどうつなげるか」が重要になります。このセクションでは、業務適用を前提としたOCR選定のポイントと、その具体的な対応例をご紹介します。

高精度なOCRと業務自動化を両立する選択肢

ここまで、主要なAI OCRツールの認識精度を比較してきました。表からも明らかなように、AIを活用したOCRは手書き文字にも強く、従来型OCRと比べて格段に高い実用性を持っています。

ただし、実際の業務で「使えるOCR」であるためには、単に文字を正確に読み取れるだけでは不十分です。たとえば次のような機能も、日々の業務を効率化するためには欠かせません。

  • 書類を種類ごとに仕分け、適切なファイル名を自動で付ける
  • 読み取ったデータをそのまま基幹システムに登録する
  • 社内マスタと照合して誤認識を自動補正する
  • 電子帳簿保存法やインボイス制度に対応している

こうした「業務フロー全体」を見据えた設計があってこそ、OCRは実務で効果を発揮します。

業務で本当に使えるOCRとは?

高精度なAI OCRが普及し、文字認識そのものは確実に進化しています。しかし、実務でのOCR活用では「読み取るだけ」ではなく、「その先の業務にどうつなげるか」が重要になります。このセクションでは、業務適用を前提としたOCR選定のポイントと、その具体的な対応例をご紹介します。

業務に使えるOCR AI JIMY Paperbotを紹介

文字を正確に読み取るだけでは、業務で“使える「OCR」とは言えません。実際の業務では、読み取った情報をいかにスムーズに処理・活用できるかが成否を分けます。たとえば、帳票の種類に応じたファイルの仕分け、自動命名、業務システムへの連携、さらには法令対応まで考慮する必要があります。

こうした実務上の要件に応えるOCRソリューションが、AI JIMY Paperbotです。AI JIMY Paperbotは、AI OCR技術とRPA(業務自動化ツール)を組み合わせ、帳票の読み取りから分類、保存、データ登録までを一貫して自動化します。

業務にフィットするOCR、その具体的な機能とは?

  • 高精度なAI OCR
    活字・手書き文字の両方に対応し、崩れた筆跡や癖字も高精度に認識。
  • RPAとの連携による業務自動化
    読み取ったデータを基幹システムに自動登録。人手による転記作業を削減。
  • 社内マスタとの照合による精度向上
    得意先名や商品名などをマスタと突合し、OCR結果を補正。誤認識を防止。
  • ファイルの自動命名・振り分け
    帳票種別や内容に応じてファイル名を付け、フォルダに自動分類。
  • 電子帳簿保存法・インボイス制度対応
    法的要件に対応した形式で帳票を保存。業務と法令の両立を支援。
  • 柔軟なカスタマイズ設計
    各社の業務フローに合わせてOCR設定や処理ルールを最適化可能。

まずはお試しから:無料トライアルのご案内

AI JIMY Paperbotでは、実際にお使いの書類で精度や機能を確認できる無料トライアルをご用意しています。OCRの導入効果は業種や書式によって異なるため、まずは気軽にお試しいただくことをおすすめします。

まとめ

AI OCRの手書き文字の読取り精度について、実際にテストを行った結果を紹介しました。今回は一般向けに公開されているAI OCRの無料ツールばかりを使用しているため、専用ツールなどを使用した場合は精度が変わっているかもしれません。あくまで、ひとつの例として見ていただければ幸いです。有料アプリなどサポートが付いている場合は、どうすれば読み取りやすくなるかなどのアドバイスもしてもらえるかもしれません。これからビジネスや企業でAI OCRを導入してみたいという方は、一度トライアルなどで試してみるのがおススメです。

AI JIMY Paperbot

この記事が気に入ったら
いいね または フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次