サーチャブルPDFについて



サーチャブルPDFについて
更新日 : 2014年9月19日
文書番号 : Q000081734



情報の再利用を容易にする 「サーチャブルPDF」

サーチャブルPDFは、紙文書を全文検索可能なPDFとして電子化する機能です。通常、紙文書をスキャンしてPDF化すると、テキスト部分を含め、すべてが画像として電子化されます。

サーチャブルPDFは、スキャン画像をPDF化する前にOCR処理にかけ、白抜き文字や地色部分の文字も含めてテスト抽出します。PDFのレイヤー機能が、この情報を透明レイヤーにし(不可視な状態で)、スキャン画像と重ね合わせたかたちでPDF化します。

これにより、画像として読める紙面に全文検索用の見えない文字情報が付加されたPDFが生成されます。この文字情報は、文字検索用としてだけでなくテキストデータとして再利用が可能です。またサーチャブルPDFは高圧縮PDFと組み合わせて生成されます。

 

[TOP▲]

この質問の対象商品(商品ごとの詳細は本文内を参照してください。)

imagePRESS C60

 

[TOP▲]
このページのトップへ