このページの本文へ

手書きAI OCRソリューションAIによる手書き文字認識

[手書きAI OCRソリューション]は、これまで、認識率が低いと言われてきた手書き文字のOCRによる文字認識に、AI技術を活用し、実用的なものにするソリューションです。キヤノン独自の画像処理技術によるOCR開発キット「Rosetta-Stone-Components」とコージェントラボのAIを活用した手書き文字OCRサービス「Tegaki」(Cogent Labs社)を連携させたシステムとしてご提供します。

手書きAI OCRソリューションの概要

日本語手書き文字認識にAI技術を応用

口座開設申込書、リース申込書、カード申込書、公共料金申込書、口座振替依頼書、振込依頼書などの各種申込用紙、やアンケート用紙など、デジタル化が進んだ今日でも紙帳票からの入力が数多く有ります。これらの入力作業では、活字のOCRによる効率化は進んできましたが、手書きの認識率は高くなく、実用化が難しい領域と言われてきました。特に、日本語の漢字やひらがな、カタカナには複雑なパーツが分かれている文字が多く、OCRによる入力効率化が困難でした。このため、未だに紙を見ながらデータ入力している企業も多いのではないでしょうか?

[手書きAI OCRソリューション]では、手書きの文字認識処理工程に、AI技術(人工知能)を活用した手書きOCRサービス「Tegaki」を採用することで、認識精度を向上します。

OCRにAI技術を採用するメリット

  • ディープラーニングによりデータを処理しながら学習することで、読み取り精度が継続的に向上
  • 業界用語への対応:トレーニングデータを用意することで、さまざまな言語、業界用語の手書き文字認識への応用も可能

導入コスト(参考価格)

  • 手書きAIOCRソリューションは、お客さまのご要件に応じた個別開発モデルになります。

手書きAI OCRソリューション

初期費用
開発内容に応じた個別見積りになります。:約500万円~
ランニングコスト
240万円/年~(従量課金方式)
保守費用
開発内容に応じた個別見積りになります。
  • ランニングコストには、手書き文字OCRサービス「Tegaki」使用料を含みます。本システムの最低利用期間は、1年です。契約年度内に途中解約の場合も、1年間の利用料合計240万円(20万円~✕12ヶ月分)を必要になります。
  • OCR対象の帳票の項目数に応じた従量課金方式です。
  • お客さまのご要件、OCR対象帳票等により、ランニングコストは変動致します。上記ランニングコスト240万円/年の最低料金で処理可能な目安は、1枚10項目の帳票で、月2万5千枚になります。

OCR処理の流れ

OCR処理の前工程として読み取りやすい画像を生成
各種帳票(口座開設申込書/口座振替依頼書/振込依頼書/各種申込書/アンケート など)→画像補正、帳票識別(定型・非定型帳票)→日本語手書きOCR→確認、修正(定型・非定型帳票)業務システム連携

OCRを使って文字を認識する際に、手書きの文字と重なる罫線、帳票の傾斜、背景色などがノイズになり、OCRエンジンの性能を充分に発揮できない事があります。これらのOCR処理の前工程を、OCR用のイメージ処理エンジンをもつキヤノンの日本語OCR開発キット「Rosetta-Stone-Components」を使用し、スキャナーから読み込まれた画像の天地補正や、帳票識別を行う事により、読み取りやすい画像を生成します。対象となる帳票は定型帳票に限らず、多様なレイアウトの帳票が混在する非定型の帳票にも対応します。レイアウトが異なっていても目的の項目をOCR抽出する事が可能です。

おもな処理の流れ
二値化→傾斜補正→方向判別→余白除去というながれで処理されるイメージ

まず、スキャナーから読み込まれた画像を二値化します。スキャン時に原稿が斜行してしまい、画像が斜めに傾いていた場合、その傾きを補正します(傾斜検知・補正)。さらに、原稿の上下(天地)がどの方向であるかを判断し、天地を正しく修正して正立した画像に変換(方向判別・補正)します。最後に、原稿端後処理によって、原稿画像の余白部分を取り除きます(余白除去)。

用紙外接ノイズ除去の例:破れなどがある用紙の黒枠画像に黒枠傾斜補正を行った場合に見られる、用紙に外接したノイズを除去する機能です。
用紙外接の部分にあるノイズが除去されたイメージ
二値化処理:カラー、グレー画像を白黒画像に変換する機能です。図は、帳票画像に対する二値化処理を行う例で、罫線がある画像を鮮明にします。帳票登録/認識の精度を目的に使用されます。
二値化処理によってブルーがかったデータを2価データに変換されたイメージ

大量の帳票を安定した搬送性能で処理するドキュメントスキャナー

キヤノンのドキュメントスキャナーと「Rosetta-Stone-Components」を組み合せてご使用いただくことで、サイズの異なる普通紙はもちろん、薄紙などの多様な帳票の読込にも対応。帳票の天地も揃えることなく、安定した搬送性能を実現しながら、一度に大量の帳票でも高速に処理することができます。

処理が完了した画像データは、AIが日本語文字認識

処理が完了した画像データは、手書き文字をすばやく、高精度にデータ化。既存技術では自動認識による読み取りが難しくキーボード入力が必要だった手書き文字情報を抽出します。

確認・修正

[手書きAI OCRソリューション]では、OCR結果の確認・修正作業を効率化する機能をご提供します。AI技術を用いても確認・修正作業は必要になります。特に非定型帳票からのOCRの場合は、抽出箇所の修正も発生する可能性が生じます。この確認・修正作業を適用業務に合わせて構築する事により、大幅な効率化が可能です。OCR認識率にも劣らず、実際の業務効率化に大きく寄与する部分である為、是非個別にご相談ください。

OCR結果の確認画面のイメージ

紙文書が存在するさまざまな業界の特定業務での入力作業に適用可能

金融機関 金融機関銀行口座開設申込書、公共料金申込書、口座振替依頼書、振込依頼書、クレジットカードの申込書、リース申込書
電気・ガス・水道 公共料金の申込書
企業のマーケティング・CSR部門 お客さまの声やアンケート用紙
医療機関 問診票、診断書
教育機関 テスト答案

関連情報

定型・非定型帳票OCRエントリーシステム(銀行向け)

従来、融資に必要な稟議において、お客さまからお預かりする決算書や、住民票、謄本、印鑑証明、納税証明書などの公的機関の書類。これらの書類は、大きさも、書式も異なるため、記載内容を目視しながら、手作業でデータ入力、原本との照らし合わせながら確認作業が行われています。「定型・非定型帳票OCRエントリーシステム」は、これらの非定型帳票から、必要なデータを抽出することで、この入力作業を効率化するソリューションです。

定型・非定型帳票OCRエントリーシステム(生命保険会社向け)

キヤノンが独自開発したOCRシステム「Rosetta-Stone-Components」のエンジンを活用し、自動で定型・非定型帳票を仕分け判断し、OCR処理するソリューションです。システムと人による判断を組み合せて、エントリー業務全体を効率化することで、お客さまへの契約の承諾、保険契約成立までのまでの時間を短縮します。

ドキュメントソリューションに関するご相談・お問い合せ

キヤノンマーケティングジャパン株式会社 デジタルドキュメントソリューション企画課