當前位置:編程學習大全網 - 源碼下載 - 開源ocr哪個好

開源ocr哪個好

紙張在許多地方已日益失寵,無紙化辦公談論40多年,辦公環境正限制紙山的生成。而過去幾年,無紙化辦公的概念發生了顯著的轉變。在計算機軟件的幫助 下,包含大量重要管理數據和資訊的文檔可以更方便的以電子形式儲存。掃描文檔的好處不純粹是存檔理由。為了訪問基於紙張的信息和將信息整合進數字工作流, 光學字符識別(OCR)技術至關重要。選擇正確的OCR工具要基於特定需求而定,例如在線OCR服務對某些人有用,但可能存在隱私問題和文件大小限制。 OCR軟件非大眾產品,因此開源替代相對於商業級重量級產品相對較少,再加上OCR軟件需要先進的算法將掃描的圖像正確翻譯成實際的文字,而圖像不僅僅含 有文字,它還包含布局、圖形和表格,可能會跨越多頁。

優秀的開源OCR軟件包括:

Tesseract

原本由惠普開發的圖像識別類庫tesseract-ocr已經更新到2.04, 就是最近Google支持的那個OCR。原先是惠普寫的,現在Open source了。

OCRopus

Ocropus的(TM)是壹個先進的文件分析和OCR系統,采用可插入的布局分析,可插入的字符識別,自然語言統計建模和多語言支持功能。

Cuneiform

Cuneiform 是壹個 OCR 文字識別系統的商標,最開始是由Cognitive 技術所開發的運行在 Windows 下的軟件。而這個項目是該軟件在 Linux 系統下的移植版本。

GOCR

GOCR 是壹個開源的OCR光學識別程序。

OCRFeeder

OCRFeeder 是 GNOME 桌面下的壹個開源 OCR 套件。可將紙質或者圖形文檔轉成電子文檔。

Lios

linux-intelligent-ocr-solution (Lios) 是Linux下壹個開源的 OCR 解決方案,可將打印的文檔轉成可編輯的文本。

  • 上一篇:微信小程序適合健身行嗎
  • 下一篇:多級鏈表源代碼
  • copyright 2024編程學習大全網