時間:2017-05-16 15:07:42 作者:不思議游戲 瀏覽量:36
在使用ABBYY FineReader 14識別文檔時,要想獲得快速準確的結(jié)果,選擇正確的OCR選項很重要,決定好要使用的選項之后,還應(yīng)該考慮文檔的類型和復(fù)雜性,以及如何去使用識別結(jié)果。
OCR選項位于ABBYY FineReader‘選項’對話框的OCR選項卡上(點擊工具 > 選項…打開此對話框)。
ABBYY FineReader 14可以自動識別添加到OCR項目的任何頁面,當前選定的選項將用于OCR過程,你也可以在圖像處理選項卡上關(guān)閉最新添加的圖像的自動分析和OCR。
注意:如果在文檔識別之后修改OCR選項,需再次運行OCR過程,通過新選項識別文檔。
1、PDF識別模式
這些設(shè)置僅適用帶有文本層和圖片的PDF文檔,這種PDF文檔通常從可編輯格式的文檔創(chuàng)建,其他類型的PDF文檔,比如可搜索的PDF文檔和僅圖像PDF文檔,通常在‘使用OCR’模式中處理,處理這種類型的PDF文檔無需額外的設(shè)置。
有三種識別模式可以使用:
•自動在OCR和PDF中的文字之間選擇
程序會檢測文本層,如果它包含高質(zhì)量的文本,便使用現(xiàn)有的高質(zhì)量文本層,OCR將用于創(chuàng)建新的文本層。
•使用OCR
OCR將用于創(chuàng)建新的文本層,這種模式花費的時間更多,但更適用于文本層質(zhì)量較差的文檔。
•僅使用PDF中的文字
這是帶有文本層PDF文檔的默認模式,程序會使用原始文本層,無需運行OCR。
2、在OCR速度和準確度之間平衡
ABBYY FineReader 14可以讓你:
•通篇識別
在這種模式下,F(xiàn)ineReader 14既可以分析和識別簡單的文檔,也可以分析識別布局復(fù)雜的文檔。這種識別需要更多時間,但最終的效果也更好。
•快速識別
這種模式建議用于處理布局簡單且圖像質(zhì)量較好的較大文檔。
3、檢測結(jié)構(gòu)元素
選擇你希望程序檢測的結(jié)構(gòu)元素:頁眉和頁腳、腳注、目錄以及編號列表,保存文檔之后,選中的元素將可點擊。
4、條碼
如果你的文檔包含條碼,你希望將它們轉(zhuǎn)化為字符串和數(shù)字,而不是保存為圖片,則勾選‘轉(zhuǎn)化條形碼為字符串’,該功能通常是默認禁用的。