當前位置:編程學習大全網 - 圖片素材 - ocr技術不能識別銀行匯票

ocr技術不能識別銀行匯票

ocr技術不能識別銀行匯票,建議用壹下奧普快票通掃描識別系統,是基於模板識別的,識別率挺高的。

1、OCR (Optical Character Recognition,光學字符識別)是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然後用字符識別方法將形狀翻譯成計算機文字的過程;即,針對印刷體字符,采用光學的方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件,並通過識別軟件將圖像中的文字轉換成文本格式,供文字處理軟件進壹步編輯加工的技術。如何除錯或利用輔助信息提高識別正確率,是OCR最重要的課題,ICR(Intelligent Character Recognition)的名詞也因此而產生。

2、衡量壹個OCR系統性能好壞的主要指標有:拒識率、誤識率、識別速度、用戶界面的友好性,產品的穩定性,易用性及可行性等。

ocr技術的發展簡史:

1、OCR的概念是在1929年由德國科學家Tausheck最先提出來的,後來美國科學家Handel也提出了利用技術對文字進行識別的想法。而最早對印刷體漢字識別進行研究的是IBM公司的Casey和Nagy,1966年他們發表了第壹篇關於漢字識別的文章,采用了模板匹配法識別了1000個印刷體漢字。

2、早在60、70年代,世界各國就開始有OCR的研究,而研究的初期,多以文字的識別方法研究為主,且識別的文字僅為0至9的數字。以同樣擁有方塊文字的日本為例,1960年左右開始研究OCR的基本識別理論,初期以數字為對象,直至1965至1970年之間開始有壹些簡單的產品,如印刷文字的郵政編碼識別系統,識別郵件上的郵政編碼,幫助郵局作區域分信的作業;也因此至今郵政編碼壹直是各國所倡導的地址書寫方式。

3、20世紀70年代初,日本的學者開始研究漢字識別,並做了大量的工作。中國在OCR技術方面的研究工作起步較晚,在70年代才開始對數字、英文字母及符號的識別進行研究,早期的OCR軟件,由於識別率及產品化等多方面的因素,未能達到實際要求。同時,由於硬件設備成本高,運行速度慢,也沒有達到實用的程度。只有個別部門,如信息部門、新聞出版單位等使用OCR軟件。進入20世紀90年代以後,隨著平臺式掃描儀的廣泛應用,以及我國信息自動化和辦公自動化的普及,大大推動了OCR技術的進壹步發展,使OCR的識別正確率、識別速度滿足了廣大用戶的要求。

  • 上一篇:猛龍用德羅贊換來了誰?妳覺得他兩誰的實力更強?
  • 下一篇:想跟壹個外國人交流,但是不知道下面的這些話怎麽用英文說出來,請哪位大俠幫下忙!謝了!!!
  • copyright 2024編程學習大全網