請問大哥,你說的OCR是什麼意思呀

時間 2022-03-07 11:45:04

1樓:匿名使用者

ocr技術是光學字元識別的縮寫(optical character recognition),是通過掃描等光學輸入方式將各種票據、報刊、書籍、文稿及其它印刷品的文字轉化為影象資訊,再利用文字識別技術將影象資訊轉化為可以使用的計算機輸入技術。可應用於銀行票據、大量文字資料、檔案卷宗、文案的錄入和處理領域。適合於銀行、稅務等行業大量票據**的自動掃描識別及長期儲存。

相對一般文字,通常以最終識別率、識別速度、版面理解正確率及版面還原滿意度4個方面作為ocr技術的評測依據;而相對於**及票據, 通常以識別率或整張通過率及識別速度為測定ocr技術的實用標準。

2樓:開口大字典

漢字識別ocr("光學字元識別"的英文編寫)是為了使漢字資訊高速輸入計算機,以解決低速的資訊輸入與高速資訊處理之間的矛盾,從而提高整個計算機系統的效率。這種根據漢字人工編碼錄入漢字文字的方法,從根本上改變了人們對計算機漢字人工編碼錄入的概念。使人們從繁重的鍵盤錄入漢字的勞動中解脫出來。

只要用掃描器將整頁文字影象輸入到計算機,就能通過ocr軟體自動產生漢字文字檔案,這與人手工鍵入的漢字效果是一樣的,但速度比手工快幾十倍。所以ocr產品的推廣意義是深遠的。

提高ocr識別率

購買了掃描器,你一定會發現,附贈的軟體中有中英文ocr識別軟體,當然一般都是基礎版。很多人認為此類ocr的識別率不是很高,甚至懷疑只有那些正版的數千元的ocr軟體其識別率才很高。其實,你只要注意使用技巧,此類ocr的識別率完全可達實用化水平。

1、處理原稿掃描影象,使之清晰可「辨」。在其它因素都滿足的前提下,對一般的印刷稿、列印稿(包括清晰的針打稿)等質量較好的文稿進行識別,其識別率一般可達到98%以上。而對報紙、影印件等不太清晰的文稿進行識別,無論哪種ocr都難以達到較高的識別率。

對那些原稿不太清晰的,要注意識別前對影象加以處理,除去其上的汙跡。並注意將偏斜的版面「改斜歸正」,通常ocr軟體均有此功能,且一般都設有自動糾偏和手動糾偏。

2、解析度應選擇適宜。一般選擇300dpi較合適,解析度選小了會使識別率降低,選得太大了並不能有效提高識別率,還會大幅度加長檔案長度,浪費處理時間。有的掃描軟體裝置上有一項「ocr掃描」,乾脆將解析度鎖定為300dpi,這是很有道理的。

3、調整好亮度值和對比度值。這條非常關鍵,對識別率的影響很大。亮度值的調整是在識別前,先看看掃描得到的影象中文字質量如何,如果文字線條凹凸不平,甚至有斷線,說明亮度值太大了,應減小亮度值;當文字線條很黑很粗,甚至擠成了黑疙瘩,分不清筆劃時,則說明亮度值太小了,應增加亮度值;對比度的調節要視原稿確定,筆者常根據預掃時影象清晰度確定。

4、利用ocr的自學習功能。有時ocr對某些字總是難以識別,比如ocr開始對「的」和「二」等字總是搞錯,這時可以利用ocr軟體的自學習功能,「引導」它正確識別一次(有些不同的字型各需一次),它以後就對這些字「熟識」了。具體操作極易,上機看一下選單即可明白。

另外,若原稿全是英文或其中中文很少,最好用附贈的英文ocr軟體。還有,現在已有一些很好的文字校對軟體,其中一般都設定了ocr校對,利用這些軟體先行處理一下所得文字檔案,則可大大減輕人工校對負擔。

參考資料

男人說你討喜是什麼意思,男人說唉是什麼意思

q魚娘老師 意思就是男人很喜歡你,他很喜歡你才會覺得你是討喜的,如果他不喜歡你,他就會覺得你是討厭的。 愛的未知一二 男人說你討喜呀,一般就是這個女生非常的可愛,討人喜歡啊,就這個意思,沒什麼其他的意思,還有一個就是可能他覺得你的性格各方面非常的好,很容易接近別人討人喜歡。 墨雨雲煙 男人說女桃心就...

女生說拿捏我是什麼意思?拿捏你是什麼意思

1 拿捏你有刁難 擠兌 為難對方的意思,捏有把握 掌握 控制的意思,意思是說刁難和不難為你。拿捏的意思 要挾 刁難 故作姿態。拼音 n ni 褒貶 貶義。2 拿捏的本意是 把握 掌握 在網路上多用於一種瞭如指掌的把控感。3 經典語句有 氣質這一塊哥還不是拿捏的死死的 拿捏了哦兄弟們 等。4 拿捏,也...

請問說文章排版是什麼意思

四海 文章輸入文字之後,文字的字型 字號都是一樣的,什麼空格標題也不是很規範,這樣的文章列印出來看著很不好看,也不正規。所以要進行排版操作,報紙雜誌排版通常要加入 插圖,對標題進行藝術字美化 公文排版則按公文格式,對標題及正文字型字號進行統一。通常標題用2號方正宋體 正文用3號仿宋,具體看一下公文排...