OCRの認識率が悪い



OCRの認識率が悪い
更新日 : 2013年1月21日
文書番号 : Q000003528



まず、同梱の弊社製スキャンツールのOCRエンジンの仕様は以下の通りです。

●文字サイズ
 日本語版 8〜48ポイント(300dpi)
 英語版 6〜72ポイント(300dpi)
 ※下限を超えると認識率が大幅に落ちます。上限を越えると文字として認識しません。

●文字数
 日本語:約6,000文字/ページ
 英語:130文字/行、100行/ページ

●対応フォント
 日本語:明朝/ゴシック
 英語版:Helvetica/courier new/Times New Roman 
 ※上記以外のフォントは認識率が落ちる可能性があります

●認識可能文字
 日本語:JIS非漢字、JIS第一水準文字、JIS第二水準文字(547文字)、ローマ数字、丸付き数字
 英語:アルファベット(52文字)、数字(10文字)、記号(30文字)、ユーロ記号
 他言語:英語、各言語固有文字 

 尚、日本語を指定した場合、認識文字にアルファベット(JIS非漢字)が含まれております。
 英語を指定した場合は、認識文字に日本語は含んでおりません。


更にOCRの精度をより高めるには、以下の点をご留意の上お試し下さい。

1.カラー原稿、白黒原稿とも、白黒2値モードで読みとります

2.Capture PerfectでPDFOCRを行っている場合は、[オプション]→[PDFファイル設定]で、OCR対象言語を[日本語と英語]にして下さい。(英語などに設定されていると、日本語のOCRは効きません)

3.原稿が傾かないよう、ドライバの斜行補正にチェックを入れる(DR-5080C/5020以外で設定可能)。原稿ガイドを原稿にぴったり合わせます。また、搬送を良くするため、ローラー清掃を行って下さい。
DR-2050シリーズ/2080Cでは原稿ガイドを取り付けて下さい。

4.濃度を適正にし読みとります。(濃過ぎず薄過ぎず)

5.解像度は原稿によりますが、300〜400dpiが適正です。

6.DR-5020/5080Cをお使いの場合は、白孤立点除去、黒孤立点除去等の設定が有効です。

7.文字や背景に色がついている場合は、テキストエンハンストモード、カラードロップアウト等の設定が有効です。

8.DR-4580U/4080Uをお使いの場合は、ノイズ除去、白基準原稿合わせ等の設定が有効です。


 

[TOP▲]

この質問の対象商品(商品ごとの詳細は本文内を参照してください。)

DR-P215 / DR-150 / DR-1210C / DR-2050SP / DR-2050CII / DR-2050C / DR-2080C / DR-C125 / DR-C130 / DR-2010C / DR-2510C / DR-M140 / DR-2580C / DR-M160 / DR-3010C / DR-3020 / DR-3060 / DR-3080CII / DR-3080C / DR-4010C / DR-4080U / DR-4580U / DR-5010C / DR-5020 / DR-5080C / DR-6010C / DR-6030C / DR-6050C / DR-6080 / DR-7080C / DR-7090C / DR-7580 / DR-9050C / DR-9080C / DR-X10C / Flatbed Scanner Unit 101

 

[TOP▲]
このページのトップへ