快捷登錄,享 免費下載
首頁 > 軟件列表 > 識別看看

軟件信息

軟件名稱:識別看看

軟件版本:2.0

軟件大小:15.6M

軟件類別: 應(yīng)用其他

軟件授權(quán): 免費軟件

軟件產(chǎn)地:國產(chǎn)軟件

軟件語言:中文

應(yīng)用平臺:WinXP, win7, WinAll

軟件介紹

識別看看是一款優(yōu)秀的文字識別(OCR)軟件,可以將一般圖片或 PDF 中的文字識別、抄錄出來,從而省去不必要的打字時間。且有比較好的識別率和識別速度,有大量掃描圖像或文檔時特別有用。

不論 PDF 圖片清淅與模糊,版面不論簡單與復(fù)雜,TryOCR 的識別率和速度都表現(xiàn)得相當出色,而且是免費的,應(yīng)該是目前國內(nèi)比較好的 OCR 工具。

測試發(fā)現(xiàn) TryOCR 簡單易用,支持文檔識別、框選識別、多行識別三種模式,另外還有額外的文字識輔助別功能,包括二值化、旋轉(zhuǎn)校正、版面分析、邊框去除、噪聲去除等,而且還是免費軟件,避免了版權(quán)風險。

像書籍,報紙,名片等含有文字的圖片,都可以稱之為文檔,都可以用這個工具按鈕來進行識別,如何處理圖片:在打開圖片后,你就可以對圖片進行處理了。二值化:打開圖片后,點擊“二值化”按鈕,圖片就變成黑白色了。打開圖片后直接點擊“文檔版面分析”按鈕,板面分析的主要作用是將文檔圖片切割成一行行文字。

版本更新

2.0版本更新內(nèi)容:

1、增加中文識別(含標點符號),暫不支持中英混合,暫不支持中文數(shù)字混合,暫不支持二級字庫,暫不支持繁體,暫不支持筆畫粘連

2、增加“配置”選項

3、不便攜帶

識別看看 TryOCR 2.0 正式版

圖像識別軟件現(xiàn)在用得較多一般有漢王OCR,以及ABBYY泰比OCR軟件,ABBYY號稱是世界排名第一,特別是英文識別上有獨到之處,漢王老牌公司具有識別率高,界面簡單友好的特點,特別適合于初學者。今天給大家介紹一款識別看看 TryOCR 2.0 正式版,該款軟件操作較為簡便,最關(guān)鍵的是綠色版,不要任何的安裝及解密,打開就可以直接使用,而且識別率也非常高,支持文檔識別、框選識別、多行識別三種模式,另外還有額外的文字識輔助別功能,包括二值化、旋轉(zhuǎn)校正、版面分析、邊框去除、噪聲去除等,相比以上三款OCR識別系統(tǒng),如果圖像較為清析估計沒什么區(qū)別,如果英文那首推ABBYY,如果你的圖片相對模糊而且版面較為復(fù)雜,那么這款tryOCR相信不會讓你失望,在識別速度上也較快。

軟件使用技巧

在最近幾年中,ocr識別技術(shù)隨著掃描儀的普及得到了飛速的發(fā)展,掃描、識別軟件的性能不斷強大并向智能化不斷升級發(fā)展。但是要想快速地獲取正確的掃描結(jié)果,得到高效率的文字錄入,必須認真學習有關(guān)知識,結(jié)合實踐經(jīng)驗,摸索出自己的全套解決方案。有時我們在作文字識別工作時識別率非常低,根本達不到軟件所說的95%以上,請先不要責怪硬件或軟件,其實這是沒有掌握好掃描及ocr識別技巧的原因。

下面是文字識別操作中經(jīng)常用到了一些方法和技巧。

1.分辨率的設(shè)置是文字識別的重要前提。一般來講,掃描儀提供較多的圖像信息,識別軟件比較容易得出識別結(jié)果。但也不是掃描分辨率設(shè)得越高識別正確率就越高。選擇300dpi或400dpi分辨率,適合大部分文檔掃描。注意文字原稿的掃描識別,設(shè)置掃描分辨率時千萬不要超過掃描儀的光學分辨率,不然會得不償失。下面是部分典型設(shè)置,僅供參考。

(1)1、2、3號字的文章段,推薦使用200dpi。

(2)4、小4、5號字的文章段,推薦使用300dpl。

(3)小5、6號字的文章段,推薦使用400dpl。

(4)7、8號字的文章段,推薦使用600dpi。

2. 掃描時適當?shù)卣{(diào)整好亮度和對比度值,使掃描文件黑白分明。這對識別率的影響最為關(guān)鍵,掃描亮度和對比度值的設(shè)定以觀察掃描后的圖像中漢字的筆畫較細但又不斷開為原則。進行識別前,先看看掃描得到的圖像中文字質(zhì)量如何,如果圖像存在黑點或黑斑時或文字線條很粗很黑,分不清筆畫時,說明亮度值太小了,應(yīng)該增加亮度值在試試;如果文字線條凹凸不平,有斷線甚至圖像中漢字輪廓嚴重殘缺時,說明亮度值太大了,應(yīng)減小亮度后再試試。

3.選好掃描軟件。選一款好的適合自己的ocr軟件是作好文字識別工作的基礎(chǔ),一般不要使用掃描儀自帶的oem軟件,oem的ocr軟件的功能少、效果差,有的甚至沒有中文識別,經(jīng)過比較,我認為清華紫光ocr2003專業(yè)版和尚書ocr6.0文本自動識別輸入系統(tǒng)的識別能力與使用功能更突出一些。再選一個圖像軟件,ocr軟件不是有掃描接口嗎?為什么還找圖像軟件?第一,ocr軟件不能識別所有的掃描儀;第二,也是最關(guān)鍵的,利用圖像軟件的掃描接口掃描出來的圖像便于處理;一般選用photoshop。

4.如果要進行的文本是帶有格式的,如粗體、斜體、首行縮進等,部分ocr軟件識別不出來,會丟失格式或出現(xiàn)亂碼。如果必須掃描帶有格式的文本,事先要確保使用的識別軟件是否支持文字格式的掃描。也可以關(guān)閉樣式識別系統(tǒng),使軟件集中注意力查找正確的字符,不再顧及字體和字體格式。

5.在掃描識別報紙或其他半透明文稿時,背面的文字透過紙張混淆文字字形,對識別會造成很大的障礙。遇到該類掃描,只要在掃描原稿的背面附。蓋一張黑紙,掃描時,增加掃描對比度,即可減少背面模糊字體的影響,提高識別正確率,

6.一般文本掃描原稿都為黑、白兩色原稿,但是在掃描設(shè)置時卻常將掃描模式設(shè)為灰度模式。特別是在原稿質(zhì)量較差時,使用灰度模式掃描,并在掃描軟件處理完后再繼續(xù)識別,這樣會得到較好的識別正確率。值得注意的是ocr識別軟件可以自己確定閥值,幾個百分點的閥值差異,可能就會影響識別的正常進行。當然,得到的圖像文件的大小會比黑白文件大很多。在進行大批量文稿掃描時,必須對原稿進行測試,找到最佳的閥值百分比。

7.遇到圖文混排的掃描原稿,首先明確使用的識別軟件是否支持自動分析圖文這一功能。如果支持的話,在進行這類掃描識別時,ocr軟件會自動計算出文本的內(nèi)容、位置和先后順序。文字部分可以按照標示順序正常識別。

8.手動選取掃描區(qū)域會有更好識別效果。設(shè)置好參數(shù)后,先預(yù)覽一下,然后開始選取掃描區(qū)域。不要將要用的文章一股腦兒選在一個區(qū)域內(nèi),因為現(xiàn)在的文章排版為了追求更好的視覺效果,使用圖文混排的較多,掃成一幅圖像會影響ocr識別。因此,要根據(jù)實際情況將版面分成n個區(qū)域,怎么劃分區(qū)域呢?每一區(qū)域內(nèi)的文字字體、字號最好一致,沒有圖形、圖像,每一行的寬度一致,遇到長短不一,再細分,一般一次最多可掃描10個選區(qū)。根據(jù)不同情況,合理地設(shè)置識別區(qū)域的順序。不要嫌這個過程太煩,那可是提高識別率的有效手段。注意各識別區(qū)域不能有交叉,做到一切覺得完好以后再進行識別。這樣一般的識別率會在95%以上,對于識別不正確的文字進行校對后,就可以進入相應(yīng)的文字處理軟件進行所需的處理了。

9.在放置掃描原稿時,把掃描的文字材料一定要擺放在掃描起始線正中,以最大限度地減小由于光學透鏡導(dǎo)致的失真。同時應(yīng)保護掃描儀玻璃的干凈和不受損害。

文字有一定角度的傾斜,或者是原稿文字部分為不正規(guī)排版,必須在掃描后使用旋轉(zhuǎn)工具,進行糾正;否則ocr識別軟件會將水平筆劃當做斜筆劃處理,識別正確率會下降很多。建議用戶盡量將掃描原稿放正,用工具旋轉(zhuǎn)糾正會降低圖像質(zhì)量,使字符識別更加困難。

10.先”預(yù)覽”整體版面,選定要掃描的區(qū)域,再用”放大預(yù)覽”工具,選擇一小塊進行放大顯示到全屏幕,觀察其文字的對比度,文字的深淺濃度,據(jù)情況調(diào)整”閥值”的大小,最終要求文字清晰,不濃(文字成團),不淡(文字斷筆伐),一般在”閥值”80左右為宜,最后再掃描。

11.用工具擦掉圖像污點,包括原來版面中的不需要識別的插圖、分隔線等,使文字圖像中除了文字沒有一點多余的東西;這可以大提高識別率并減少識別后的修改工作。

12.如果要掃描印刷質(zhì)量稍微差一些的文章,比如說報紙,掃描的結(jié)果將不會黑白分明,會出現(xiàn)大量的黑點,而且在字體的筆畫上也會出現(xiàn)粘連現(xiàn)象,這兩項可是漢字識別的大忌,將嚴重影響漢字識別的正確率。為獲得較好的識別結(jié)果,必須仔細進行色調(diào)調(diào)節(jié),反復(fù)掃描多次才能獲得比較理想的結(jié)果。另外由于報紙很薄且大部分紙質(zhì)不高,導(dǎo)致掃描儀上蓋板不能完全壓住報紙(有縫隙),所以一般情況下報紙的掃描識別效果沒有雜志的效果好。解決辦法是在報紙上壓一至兩本16k的雜志,效果還是不錯的。

版本列表

  • TryOCR(識別看看) v6.5 綠色版

    TryOCR(識別看看) v6.5 綠色版

    TryOCR識別看看是一款免費的OCR文字識別軟件,它可以自動識別PDF或者圖片中的 ...

    軟件大?。?span id="psle0dq" class="gray">15.65 MB 更新時間:2020-07-02
    詳情