国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術文章
文章詳情頁

python實現圖像識別的示例代碼

瀏覽:82日期:2022-06-24 13:09:21
一、安裝庫

首先我們需要安裝PIL和pytesseract庫。PIL:(Python Imaging Library)是Python平臺上的圖像處理標準庫,功能非常強大。pytesseract:圖像識別庫。

我這里使用的是python3.6,PIL不支持python3所以使用如下命令

pip install pytesseractpip install pillow

如果是python2,則在命令行執行如下命令:

pip install pytesseractpip install PIL

這時候我們去運行上面的代碼會發現如下錯誤:

python實現圖像識別的示例代碼

錯誤提示的很明顯:No such file or directory :'tesseract'

這是因為我們沒有安裝tesseract-ocr引擎

二、tesseract-ocr引擎

光學字符識別(OCR,Optical Character Recognition)是指對文本資料進行掃描,然后對圖像文件進行分析處理,獲取文字及版面信息的過程。OCR技術非常專業,一般多是印刷、打印行業的從業人員使用,可以快速的將紙質資料轉換為電子資料。關于中文OCR,目前國內水平較高的有清華文通、漢王、尚書,其產品各有千秋,價格不菲。國外OCR發展較早,像一些大公司,如IBM、微軟、HP等,即使沒有推出單獨的OCR產品,但是他們的研發團隊早已掌握核心技術,將OCR功能植入了自身的軟件系統。對于我們程序員來說,一般用不到那么高級的,主要在開發中能夠集成基本的OCR功能就可以了。這兩天我查找了很多免費OCR軟件、類庫,特地整理一下,今天首先來談談Tesseract,下一次將討論下Onenote 2010中的OCR API實現??梢栽谶@里查看OCR技術的發展簡史。Tesseract的OCR引擎最先由HP實驗室于1985年開始研發,至1995年時已經成為OCR業內最準確的三款識別引擎之一。然而,HP不久便決定放棄OCR業務,Tesseract也從此塵封。數年以后,HP意識到,與其將Tesseract束之高閣,不如貢獻給開源軟件業,讓其重煥新生--2005年,Tesseract由美國內華達州信息技術研究所獲得,并求諸于Google對Tesseract進行改進、消除Bug、優化工作。

###安裝tesseract-ocr引擎

brew install tesseract

然后我們通過tesseract -v看一下是否安裝成成功

tesseract 3.05.01leptonica-1.75.0libjpeg 9b : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11

這時候我們運行上面代碼會出現亂碼

python實現圖像識別的示例代碼

這是因為tesseract默認只有語言包中沒有中文包,如下圖:

python實現圖像識別的示例代碼

###安裝tesseract-ocr語言包我們去GitHub下載我們需要的語言包,這里我只下載了chi_tra.traineddata和chi_sim.traineddatagithub:tesseract-ocr/tessdata然后放到/usr/local/Cellar/tesseract/3.05.01/share/tessdata路徑下面。

可以通過tesseract --list-langs查看本地語言包:

python實現圖像識別的示例代碼

可以通過tesseract --help-psm 查看psm

python實現圖像識別的示例代碼

0:定向腳本監測(OSD)1: 使用OSD自動分頁2 :自動分頁,但是不使用OSD或OCR(Optical Character Recognition,光學字符識別)3 :全自動分頁,但是沒有使用OSD(默認)4 :假設可變大小的一個文本列。5 :假設垂直對齊文本的單個統一塊。6 :假設一個統一的文本塊。7 :將圖像視為單個文本行。8 :將圖像視為單個詞。9 :將圖像視為圓中的單個詞。10 :將圖像視為單個字符。

為什么這里要強調語言包和psm,因為我們在使用中會用到,比如多個語言包組合并且視為統一的文本塊將使用如下參數:

pytesseract.image_to_string(image,lang='chi_sim+eng',config='-psm 6')

這里我們通過+來合并使用多個語言包。

接下來我們看一下配置好一切的正確結果。

import pytesseractfrom PIL import Imageimage = Image.open('../pic/c.png')code = pytesseract.image_to_string(image,lang='chi_sim',config='-psm 6')print(code)

python實現圖像識別的示例代碼

python實現圖像識別的示例代碼

此時大公告成。

到此這篇關于python實現圖像識別的示例代碼的文章就介紹到這了,更多相關python 圖像識別內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 欧美人成人亚洲专区中文字幕 | 正在播真实出轨炮对白 | 日本成人免费观看 | 国产精品欧美一区二区在线看 | 成人一级片| 欧美一级高清黄图片 | 久久99国产精品久久99果冻传媒 | 免费毛片儿| 国产高清一区二区三区视频 | heyzo北条麻妃久久 | 国产成人av在线 | 亚洲一区在线播放 | 国产普通话一二三道 | 亚洲国产一区二区三区四区五区 | 日韩欧美自拍 | 亚洲精品一区二区三区国产 | 亚洲在线不卡 | 欧美一级在线观看 | 国产99视频精品免费视频7 | 男女性高爱潮免费的国产 | 老司机深夜影院入口aaaa | 亚洲精品456在线播放无广告 | 国产大乳喷奶水在线看 | 不卡无毒免费毛片视频观看 | 草草视频手机在线观看视频 | 欧美成人午夜毛片免费影院 | 亚洲一区视频在线 | 亚洲国产精品久久 | 国产九九精品 | 亚洲女精品一区二区三区 | 久久精品亚洲乱码伦伦中文 | 在线成人免费观看国产精品 | 国产精品亚洲高清一区二区 | 国产99视频精品免视看7 | 中文字幕一区二区三区精彩视频 | 美女黄视频免费观看 | 国产人成午夜免费噼啪视频 | 美女张开大腿让男人桶 | 国产精品视频一区二区猎奇 | 国产性较精品视频免费 | 99视频在线国产 |