IT Lab艾鍗學院技術Blog: VS2017 設定Tesseract-OCR的編譯環境

2018年8月11日星期六

Tesseract是一個光學字元識別引擎，支援多種作業系統。

[Include 目錄] (增加一項)

[程式庫目錄]

[其他相依性]

[C/C++ 前置處理器] 前置處理器定義

設定完成後, 執行上課範例, 可以看見原始影像為TAW-8686.jpg 然後看看Tesseract識別引擎的效果. 理論上"乾淨"的圖識別的效果應該100%正確!

但實際上取得的車牌影像不會如此乾淨, 車牌會有污點、影像對比度可能也不足(光線影響)、拍攝角度不對以及有其他的文字、符號等等., 都得再經過影像處理的手法重新把影像"惡搞"後,才能丟入OCR去做後續的文字分析識別

台灣的車牌

影像經過二值化處理，將原始影影像轉換成"黑白"影像, 至於Threshold value 怎麼選, 這就是學問所在啦~

若想要用自己的識別引擎去分析文字或一些特定的符號，也可以自己去訓練。訓練的方法可以用現在很夯的AI方法如Deep Learning CNN來訓練模型，像是 MINST 手寫數字辨識這種資料集(Data Set) 模型可以讓你識別出0~9的手寫數字。

不過在做真正的影像識別的應用，通常得經過一些影像處理的技巧, 例如進行二值化 (Thresholding）、閾值分析、影像去雜訊、影像模糊、影像強化、影像縮放、色彩空間轉換及影像切割等，才餵進到識別引擎，以獲得較高的辡別率。因此，對影像進行預處理，總是避免不了~

2018年8月11日 星期六