" />
這是tesseract-ocr-setup-3.02.02.exe 官方綠色版下載,是款功能非常強(qiáng)大的圖像識(shí)別類(lèi)庫(kù);這款軟件一開(kāi)始是由惠普進(jìn)行開(kāi)發(fā)的,畫(huà)面成為了Open source,而且軟件推出之后,成績(jī)一直都是相當(dāng)?shù)睦硐,不過(guò)由于時(shí)間的不斷增加,軟件也就越來(lái)越顯得力不從心,不過(guò)軟件的許多的功能還是相當(dāng)?shù)牟诲e(cuò)的,而且擁有的一些技術(shù)也是相當(dāng)?shù)某,使它一直的都在不斷的保持著?jìng)爭(zhēng)力;軟件的操作簡(jiǎn)單,運(yùn)行穩(wěn)定,需要的朋友千萬(wàn)不要錯(cuò)過(guò)!
光學(xué)字符識(shí)別(OCR,Optical Character Recognition)是指對(duì)文本資料進(jìn)行掃描,然后對(duì)圖像文件進(jìn)行分析處理,獲取文字及版面信息的過(guò)程。OCR技術(shù)非常專(zhuān)業(yè),一般多是印刷、打印行業(yè)的從業(yè)人員使用,可以快速的將紙質(zhì)資料轉(zhuǎn)換為電子資料。目前國(guó)內(nèi)水平較高的中文ocr有清華文通、漢王、尚書(shū)等,其產(chǎn)品各有千秋,價(jià)格不菲。國(guó)外OCR發(fā)展較早,像一些大公司,如IBM、微軟、HP等,即使沒(méi)有推出單獨(dú)的OCR產(chǎn)品,但是他們的研發(fā)團(tuán)隊(duì)早已掌握核心技術(shù),將OCR功能植入了自身的軟件系統(tǒng)。對(duì)于一般的程序員來(lái)說(shuō),一般用不到那么高級(jí)的,主要在開(kāi)發(fā)中能夠集成基本的OCR功能就可以了。
Microsoft Visual C++ 2005 SP1 Redistributable Package (x86) (VC2005運(yùn)行庫(kù)下載)安裝在未安裝 Visual C++ 2005 SP1 的計(jì)算機(jī)上運(yùn)行使用 Visual C++ 開(kāi)發(fā)的應(yīng)用程序所需的 Visual C++ 庫(kù)的運(yùn)行時(shí)組件。
VC2005運(yùn)行庫(kù)安裝 C Runtime (CRT)、Standard C++、ATL、MFC、OpenMP 和 MSDIA 庫(kù)的運(yùn)行時(shí)組件。對(duì)于支持并行部署模式的庫(kù)(CRT、SCL、ATL、MFC 和 OpenMP),這些運(yùn)行時(shí)組件安裝在支持并行程序集的 Windows 操作系統(tǒng)版本的本機(jī)程序集緩存中,這一緩存也稱(chēng)為 WinSxS 文件夾。
托管所有代碼
存儲(chǔ)庫(kù)幫助您將代碼保存在一個(gè)位置,即使您使用SVN或使用Git LFS處理大文件也是如此。
由于所有GitHub計(jì)劃都包含無(wú)限的私有存儲(chǔ)庫(kù),您可以根據(jù)需要?jiǎng)?chuàng)建或?qū)肴我鈹?shù)量的項(xiàng)目。自信地進(jìn)行更改
以精確的提交更改代碼,以便您可以快速搜索修訂歷史記錄中的每個(gè)提交消息以查找更改。
使用blame視圖來(lái)跟蹤更改,并發(fā)現(xiàn)您的文件和您的代碼基礎(chǔ)是如何演變的。包和發(fā)布代碼
當(dāng)您準(zhǔn)備好分享時(shí),您可以將最近關(guān)閉的里程碑或完成的項(xiàng)目的更改打包到新版本中。
草擬和發(fā)布發(fā)行說(shuō)明,發(fā)布預(yù)發(fā)布版本,附件,并直接鏈接到最新的下載。
數(shù)年以后,HP意識(shí)到,與其將Tesseract束之高閣,不如貢獻(xiàn)給開(kāi)源軟件業(yè),讓其重?zé)ㄐ律?005年,Tesseract由美國(guó)內(nèi)華達(dá)州信息技術(shù)研究所獲得,并求諸于Google對(duì)Tesseract進(jìn)行改進(jìn)、消除Bug、優(yōu)化工作。
Tesseract目前已作為開(kāi)源項(xiàng)目發(fā)布在Google Project,其項(xiàng)目主頁(yè)在這里查看,其最新版本3.0已經(jīng)支持中文OCR,并提供了一個(gè)命令行工具。
不像其他OCR引擎(例如美國(guó)郵政業(yè)用于分類(lèi)郵件的),Tesseract不能識(shí)別手寫(xiě),而且只能識(shí)別一共大約64中字體的文本。
Tesseract需要一些處理來(lái)改善OCR結(jié)果,圖像需要被放縮,圖像有非常多的差異,另外還有水平排布的文字。
最后,Tesseract僅僅支持Liuux,Windows,Mac OS X。