AI OCRにインターネットは必要?クラウドとオンプレの選び方とセキュリティ対策

AI OCRにインターネット接続は必要?クラウド vs オンプレミスの選択肢とセキュリティ対策

AI OCRを利用する時、一般にインターネットを経由して、クラウドサーバに接続する事になります。しかし、個人情報や社内の機密事項を扱うため、インターネットに接続できない環境もあります。官公庁でも、インターネットへの接続は制限されているのではないでしょうか。

この記事では、AI OCRにクラウド接続が必要な理由と、必要であるならセキュリティを考慮したインターネット経由での利用について、まとめてみました。

目次

AI OCRとは?

デジタル化が進む中で、紙の書類を効率的にデータ化する手段として注目されているのがAI OCR(人工知能を活用した光学文字認識)です。従来のOCR技術と比べて、より高精度で多様な書式や手書き文字を認識できるため、企業や官公庁の業務効率化に貢献しています。本セクションでは、AI OCRの基本的な仕組みや活用シーン、導入方法の違いについて解説します。

AI OCRの仕組み

AI OCR(人工知能を活用した光学文字認識)は、紙の書類や画像に含まれる文字をデジタルデータに変換する技術です。従来のOCR(光学文字認識)は、特定のフォントや活字に最適化されており、手書き文字や複雑なレイアウトの文書では誤認識が発生しやすいという課題がありました。

AI OCRはディープラーニング(深層学習)技術を活用することで、手書き文字、異なるフォント、崩れた文字、さらには汚れやノイズがある文書でも高精度に認識することが可能です。この結果、紙ベースの業務プロセスをデジタル化し、検索性や管理の効率を飛躍的に向上させることができます。

AI OCRの主な活用シーン

AI OCRは、多くの業界で活用されています。以下は代表的な導入事例です。

  • 企業の文書管理
    • 契約書、請求書、納品書などの紙文書をデジタル化し、検索・管理を容易にする。
    • 経理・会計業務の自動化に貢献。
  • 官公庁の業務効率化
    • 紙ベースの申請書や公的文書を電子化し、データ入力作業を削減。
    • 過去の文書をデジタルアーカイブ化し、迅速な検索を可能にする。
  • 医療・物流業界
    • 手書きの診療記録や処方箋をデジタル化し、電子カルテと連携。
    • 荷物のラベルや送り状の文字を自動認識し、物流業務を効率化。

クラウド型 vs オンプレミス型

AI OCRの導入方式には、大きく分けて「クラウド型」と「オンプレミス型」の2種類があります。それぞれの特長を比較すると、以下のようになります。

スクロールできます
方式特長メリットデメリット
クラウド型インターネット経由でOCRエンジンを利用・高性能なAI OCRを即座に利用可能
・システムのメンテナンス不要
・定期的なアップデートで認識精度が向上
・インターネット接続が必須
・機密情報の取り扱いに注意が必要
・利用頻度によってはコストが増加
オンプレミス型自社サーバーで運用・インターネットを介さずに処理可能
・セキュリティ面で優れている
・機密情報の保護が容易
・初期導入コストが高い
・サーバーやシステムの保守管理が必要
・AIモデルの更新に手間がかかる

クラウド型は導入・運用コストが低く、継続的に最新のAIを利用できるメリットがある一方で、オンプレミス型はセキュリティ面での安心感が大きいという特徴があります。どちらを選択するかは、業務内容やセキュリティ要件に応じて決定する必要があります。

▶AI OCRとRPAが標準搭載!書類のデジタル化からデータ入力まで自動で完了!AI JIMYはこちらから

クラウド型AI OCRのメリットとインターネット接続が必要な理由

クラウド型AI OCRは、高精度な文字認識や柔軟な処理能力を備え、多くの企業や官公庁で活用されています。インターネット接続が必要なのは、クラウド上の計算リソースを活用し、常に最新のAIモデルを利用するためです。本セクションでは、そのメリットとインターネット接続が求められる理由を解説します。

クラウド型AI OCRのメリット

クラウド型AI OCRは、インターネット経由で高性能なOCRエンジンを利用できるため、以下のようなメリットがあります。

最新のAI OCRエンジンを常に利用可能

クラウド型AI OCRは、定期的にAIモデルのアップデートが行われ、手書き文字や特殊なフォントの認識精度が向上し続けます。従来のオンプレミス型OCRでは、アップデートを自社で管理する必要がありますが、クラウド型なら常に最新の技術を活用できます。

スケーラビリティに優れ、大量のデータ処理が可能

スケーラビリティとは、システムが処理能力を柔軟に拡張できる特性を指します。クラウド型AI OCRは、利用状況に応じて計算リソースを動的に増減できるため、急な業務の増加にもスムーズに対応できます。

例えば、繁忙期に大量の書類をOCR処理する必要がある場合でも、クラウド環境ならリソースを自動的に拡張し、遅延なく処理を実行できます。

一方、オンプレミス型では、予め大容量のサーバーを用意する必要があり、コストや管理負担が増加する可能性があります。

システムの保守・管理が不要

クラウドサービス提供者がOCRエンジンを管理・メンテナンスするため、ユーザー側の運用負担が軽減されます。自社でOCR環境を構築する場合、ハードウェアの管理やソフトウェアの更新が必要ですが、クラウド型ではそれらを気にする必要がありません。

クラウド型AI OCRにインターネット接続が必要な理由

クラウド型AI OCRは、インターネットを通じてクラウド上の高性能なOCRエンジンを利用する仕組みになっており、インターネット接続が不可欠です。主な理由として、以下の3点が挙げられます。

1.高性能なAIモデルを利用するため

クラウド型AI OCRでは、大量のデータを学習した最先端のAIモデルを活用します。ローカル環境では処理が困難な高度な文字認識技術を、インターネットを介して利用できるのが大きな利点です。

2.計算リソースをクラウド側で確保するため

OCR処理には、膨大な計算能力が必要です。クラウド型では、サーバー上の強力なGPU(グラフィックス処理ユニット)やAI処理に特化したNPU(Neural Processing Unit)を活用し、ユーザー側で高性能なハードウェアを準備する必要がありません。そのため、初期導入コストの削減が可能となります。

3.リアルタイムでの精度向上とアップデートの適用

クラウド型AI OCRは、定期的にAIモデルの更新が行われ、継続的に認識精度が向上します。ローカル環境では手動でアップデートを適用する必要がありますが、クラウド型なら最新の技術を即座に利用できます。

オフラインでのAI OCR利用は可能か?

クラウド型AI OCRは高精度な文字認識や利便性の面で優れていますが、企業や官公庁の中には、セキュリティ上の理由からインターネット接続を利用できない環境も存在します。そのような場合、ローカル環境で動作するオンプレミス型AI OCRの導入が選択肢となります。本セクションでは、オフライン環境でAI OCRを利用する際の特徴や導入の課題について解説します。

オフラインAI OCRの特徴

インターネット接続が制限される環境では、クラウド型ではなくオンプレミス型のAI OCRが選択肢となります。オンプレミス型は、社内ネットワーク内で完結するため、外部とのデータ通信が不要であり、機密性の高い情報を扱う企業や官公庁に適しています。

オフライン環境の課題

セキュリティ面で安心できる反面、オンプレミス型AI OCRには以下のような課題もあります。

ハードウェア要件が高い

オンプレミス型AI OCRを導入する場合、高精度なOCR処理を実現するための専用ハードウェアが必要になります。特に、大量の書類を高速かつ正確に処理するには、高性能なGPUやNPUが求められます。これらのハードウェアは一般的なPCやサーバーには搭載されていないため、専用機材の購入やアップグレードが必要となり、初期投資が大きくなる点が課題です。

また、OCR処理のパフォーマンスは、ハードウェアの性能に大きく依存します。例えば、処理速度を向上させるために並列処理を行う場合、高性能なサーバーが複数台必要になることもあります。 そのため、導入時にはOCRの使用頻度や処理量を考慮し、適切なハードウェア構成を検討する必要があります。

AIモデルの更新が難しい

クラウド型AI OCRでは、サービス提供者が定期的にAIモデルを更新し、精度向上を図ります。しかし、オンプレミス環境では、AIモデルの更新を自社で管理する必要があり、最新の技術を即座に反映できないという課題があります。

AI OCRの認識精度を維持するには、AIモデルを定期的に再学習させ、アップデートを適用することが不可欠です。しかし、オンプレミス環境では、新しいAIモデルを適用するには手動でのインストール作業が必要となり、システム担当者の負担が増加します。さらに、モデルの更新にはデータセットの準備やチューニングが必要になることもあり、専門的な知識が求められます。

また、一部のオンプレミス型OCRソフトウェアでは、AIモデルのアップデートが有償オプションとなっている場合もあります。そのため、導入時のコストだけでなく、継続的な運用コストも考慮する必要があります。

システムの保守が必要

オンプレミス型AI OCRは、自社内のサーバー環境で動作するため、ハードウェアの管理やソフトウェアのメンテナンスを自社で行う必要があります。 クラウド型のように自動的に更新や最適化が行われるわけではないため、定期的なメンテナンスが欠かせません。

例えば、OCRエンジンのパフォーマンスを維持するためには、サーバーの適切な負荷分散やストレージの管理が必要です。OCR処理によって大量のデータが蓄積されるため、ストレージ容量の確保やバックアップ体制を整える必要もあります。また、ハードウェアの故障やソフトウェアのバグ対応など、トラブル発生時の迅速な対応が求められます。

さらに、セキュリティ対策の継続的な実施も重要です。オンプレミス環境では、システムの脆弱性を突いた攻撃を防ぐために、ファイアウォールの設定やアクセス管理の強化、ウイルス対策ソフトの導入などが必要になります。これらの管理を適切に行わないと、情報漏えいやシステム障害のリスクが高まるため、運用負担が増大する可能性があります。

オンプレミスとクラウドの使い分け

オンプレミス型AI OCRは、インターネット接続なしで運用できるメリットがある一方、導入・管理コストが高くなります。そのため、機密性が最優先の業務にはオンプレミス、コストや利便性を重視する場合はクラウド型AI OCRを選ぶなど、用途に応じた選択が重要です。

クラウド型AI OCRを安全に利用するためのセキュリティ対策

クラウド型AI OCRは、必要な時に柔軟に利用でき、システム管理の負担を軽減できるメリットがあります。しかし、インターネットを経由してデータを処理するため、セキュリティ対策の確立が不可欠です。本セクションでは、ネットワークの安全性、データの取り違え防止、不要な情報のマスキング、処理後のデータ削除といった観点から、クラウド型AI OCRを安全に利用するための具体的な対策を解説します。

(1) 安全な通信環境を確保するには?

例えば、以下の構成のAI OCR製品を考えます。

①クライアントソフトから画像データをWebAPIに投げます。
②通信はHTTPSで暗号化されます。
③中継サーバ(WebAPI)は画像データを受け取り、必要な処理を行います。
④通信はHTTPSで暗号化されます。
⑤文字認識エンジン(生成AI)で文字認識を行い、今の道を逆にたどってデータを返します。

上記①~⑤を、下図に整理しました。

AI OCRの通信構成図

上の図では、それぞれの間の通信はHTTPSで行います。

HTTPSを利用することで、(a)データが暗号化され、(b)改ざんされず、(c)本物のサーバであることを認証してなりすましを防ぎます。

古い暗号化技術は攻撃に弱いため、最新の暗号化技術を使う必要があります。しかし、公共Wi-Fiは攻撃に弱いため、使わないほうが望ましいなどの注意点はありますが、ネットワーク通信のセキュリティは充分確保されていると言えます。

次の図は、もう少しセキュリティを高めた例です。

セキュリティ強化したAI OCRの通信構成図

⑤文字認識エンジンがインターネットに露出していると、個別に攻撃を受ける可能性があります。そのため、⑥VPNで③中継サーバと⑤文字認識エンジンをひとまとめにすることで、外部からの攻撃に対して、より強固になります。

しかし、⑤文字認識エンジンの仕様上、上記構成が取れないこともあります。製品により異なりますが、一例として、AI JIMY Paperbot の場合を記載します。旧エンジンでは③中継サーバと⑤文字認識エンジンをひとまとめにすることが出来ませんでしたが、新エンジンは可能になりました。

最後の図は、VPNを使うことで、仮想的に社内ネットワークに取り込んでいる例です。

AI OCRのVPN利用構成図

①クライアントソフトをインストールした利用端末も含めてVPN化することで、外部からの接続を防ぐことができます。この場合、③中継サーバや⑤文字認識エンジンは公開されないので、他の利用者が利用することはできません。

例えば、クラウド型AI OCRは、テナントビルのような仕組みです。一つの大きな建物を複数の企業が利用するように、クラウドサーバーも多くのユーザーが共同で利用し、コストを抑えながら運用できます。

一方で、オンプレミス型AI OCRは、ビルを丸ごと借りるようなものです。専用の環境を持てる反面、コストや管理の負担が大きくなります。

なお、クラウド型AI OCRのセキュリティは、各テナントの部屋ごとに施錠されているように、VPNやアクセス制御によって厳重に管理されています。

一例に出したAI JIMY PaperbotはMicrosoft Azure上で提供され、脆弱性につながる不要な機能を排除し、クラウド側で標準的なセキュリティ対策が施されています。

(2) データの取り違えを防ぐには?

外部からの攻撃だけではなく、障害によるデータ漏洩の可能性が気になります。

上記の例、X社とY社が同時に中継サーバにデータを送信した時、取り違えは発生しないのでしょうか。また、第三者が、X社やY社に成りすましてデータを受け取ることはないのでしょうか。

製品により異なりますが、一例として、AI JIMY Paperbot の場合を記載します。

同製品では、各処理に対してトークン(固有の識別コード)を割り当て、誤ったデータの混在を防いでいます。各セッションの管理に利用しているトークンは128ビットの値で構成しており、偶然一致する確率は 0.000000000000000000000000000000000000294% なので、取り違えはまず発生しないものと言えます。

例えば、X社が中継サーバにデータを送信して文字認識を依頼すると、サーバからトークンを受け取ります。X社は、トークンと引き換えに認識結果を取得します。

このような方式を採用することで、X社の文字認識結果がY社に誤って提供されることや不正なトークンを使用したなりすましが、発生するリスクを防ぐことが可能です。

トークンの仕組み

(3) 不要な情報を送信しないためのマスキング技術

帳票には、文字認識の対象ではないものの、外部に漏らしたくない情報が含まれることがあります。特に、不要なデータをインターネット経由で送信すること自体を避けたいと考える企業や官公庁も多いでしょう。

この点に対応するため、一部のAI OCR製品では、必要な部分だけを切り取ってサーバに送信できる機能を備えています。例えば、料金体系が1項目単位の製品では、特定の文字認識領域のみを処理対象とし、それ以外の情報を送信しない仕組みになっている場合があります。ただし、製品によっては全文をサーバに送信する仕様のものもあるため、導入時に確認が必要です。

全文を送信する製品の例として、AI JIMY Paperbot の場合では、送信したくない箇所を隠したり、見えなくしたりするマスキング処理を行う機能があります。

データのマスキング

上記の例では、会社名、カナ氏名、漢字氏名欄をマスキングしているので、サーバに送信されることがありません。例えば「会員番号」や「社員ID」などの固有の番号や名前とページ番号の対応表で、実名を利用せずに認識結果を利用する運用が可能です。

(4) 処理後のデータを安全に削除する仕組み

データが中継サーバや文字認識エンジンに渡されますが、ここからデータが漏洩する心配はないのでしょうか。

製品により異なりますが、AI JIMY Paperbot の場合では処理済みのデータは、認識元の画像データ、認識結果の文字データ共に、即時削除します。また、通信処理は1ページごとに行われるため、例えば50ページのPDFを文字認識する場合でも、サーバには1ページずつ順番に送信されます。

なお、文字認識エンジンでは、文字認識処理を行ったデータは破棄し学習には利用しません。サーバセキュリティが万が一破られても、大量のデータが流出する事態は避けられるようになっています。

▶AI OCRとRPAが標準搭載!書類のデジタル化からデータ入力まで自動で完了!AI JIMYはこちらから

LGWAN(総合行政ネットワーク)対応について

地方公共団体では、セキュリティの観点からインターネット接続が制限されることが少なくありません。そのため、クラウド型AI OCRを導入する際には、LGWAN(総合行政ネットワーク)への対応が重要な要件となります。本セクションでは、LGWAN環境におけるAI OCRの導入方法や、その活用メリットについて解説します。

LGWANとは?

LGWAN(Local Government Wide Area Network、総合行政ネットワーク)は、地方公共団体専用の閉域ネットワークで、地方公共団体情報システム機構(J-LIS)が運営しています。インターネットと分離されているため、外部からのサイバー攻撃を防ぎつつ、自治体間で安全にデータをやり取りできる環境を提供します。

LGWAN対応AI OCRの必要性

自治体では住民情報や税務データなど、機密性の高い情報を扱うことが多く、インターネット接続が制限されている場合があります。そのため、一般的なクラウド型AI OCRを利用できず、LGWAN環境で動作するAI OCRの導入が求められています。LGWAN対応のAI OCRを活用することで、高いセキュリティを維持しながら紙文書のデジタル化を進めることが可能になります。

LGWAN環境でAI OCRを利用する方法

LGWAN対応のAI OCRを導入する方法として、以下の2つが考えられます。

  1. LGWAN-ASPサービスを利用する
    • LGWAN-ASPとは、LGWAN内で提供される業務支援サービスのことで、OCR機能をASP経由で利用することで、インターネットを介さずにOCR処理が可能になります。
    • ASP事業者が提供するOCRサービスを導入すれば、自治体ごとにシステムを構築する負担が軽減され、運用コストの削減につながります。
  2. オンプレミス型AI OCRをLGWAN環境に導入する
    • LGWANネットワーク内にAI OCRをインストールし、ローカル環境で運用する方式です。
    • 外部ネットワークと完全に分離された環境でOCR処理ができるため、機密情報の漏えいリスクを最小限に抑えながら利用可能です。
    • ただし、システムの管理や定期的なアップデートを自治体側で行う必要があるため、運用負担が増える点には注意が必要です。

LGWAN対応AI OCRの導入メリット

LGWAN対応のAI OCRを導入すると、以下のようなメリットがあります。

  • セキュリティの確保:インターネットを介さずにOCR処理を行い、機密情報を安全に管理できる。
  • 業務の効率化:紙書類のデジタル化により、行政事務の負担を軽減し、住民対応の迅速化につながる。
  • 自治体間でのデータ活用:LGWAN内でのOCRデータの共有が可能になり、複数の自治体間での連携が円滑に進む。

LGWAN対応のAI OCRは、自治体のセキュリティ要件を満たしながら、行政のデジタル化を推進するための重要なツールとなります。

まとめ

AI OCRの導入には、クラウド型とオンプレミス型の選択肢があります。クラウド型は低コストかつ迅速に導入できる一方、インターネット接続が必要で、セキュリティ対策が求められます。対して、オンプレミス型はインターネットを使用せずに運用できますが、導入コストや保守負担が大きくなります。

クラウド型を安全に活用するには、通信の暗号化、データのマスキング、処理後のデータ削除などのセキュリティ対策が重要です。例えば、AI JIMY PaperbotはMicrosoft Azureを活用し、強固なセキュリティ基盤のもとで運用できます。

自社の要件に応じて最適な導入方法を選び、業務効率化とセキュリティの両立を目指しましょう。

AI JIMY Paperbot 公式ページより

AI JIMY Paperbotを利用するメリット

OCRに生成AIとRPAを搭載 一つのツールでデータ入力作業を完結

画像の取り込みから取引先ごとの仕分け、手書き文字の認識、テキストデータの出力、業務システムへのデータ入力まで、一連の作業をAI JIMY Paperbotひとつで自動化できます。

無料で誰でもカンタンに使用可能

AI JIMY Paperbotは特別な技術知識は不要で、マウスだけの直感的な操作が可能です。RPAツールとの連携や専門知識が必要なAPIなどの開発作業は必要ありません。無料で利用開始できますので、カンタンに試すことができます。

自動でファイル名を変換できるリネーム機能

リアルタイム処理を行い、任意で電子帳簿保存法の改正にも対応したファイル名に自動で変換可能です。

AI類似変換で社内のマスタと連携し、文字認識が向上

日本語の認識は、手書きも含めてかなり高い精度で変換できます。間違いやすい商品名などの固有名詞は、あらかじめAI JIMY Paperbotに登録しておくことでさらに認識率が向上します。

多様な業務で活用

さまざまな業務で使用が可能です。FAXの受注入力、請求書の集計、手書きアンケートや申込書のデータ入力、作業日報のデジタルデータ化など多岐にわたる業務プロセスをサポートします。

この記事が気に入ったら
いいね または フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次