★★★★★【電腦視覺】、【80個Python大師級實例】★★★★★
鷹眼王者的銳利捕捉,電腦視覺應用精準秒殺!本書特色◎ 案例涵蓋面廣、實用、擴充性、可讀性強
本書以「概述+案例」的形式進行編寫,充分強調案例的實用性及程式的可擴充性,所選案例大多數來自日常生活中,應用性強。另外,書中每個案例的程式都經過偵錯與測試,同時程式碼中增加了大量的解釋說明,可讀性強。
◎ 點線面完美結合,兼顧性強
本書點線面兼顧,涵蓋了數位影像處理中幾乎所有的基本模組,並涉及視訊處理、對位拼接、數位浮水印等進階影像處理方面的內容,全面講解了基於Python 進行電腦視覺應用的原理及方法,內容做到完美連結與統籌兼顧,讓讀者實現了由點到面進行發散性延伸。
本書技術重點✪Python電腦視覺基礎,包括常用的函數庫。
✪各種去霧演算法、空域增強,時域增強,色階調整、Hough變換檢測。
✪分割車牌處理、包括定位,字元處理及辨識。
✪分水嶺演算法,用在醫學診斷。
✪CNN及SVC手寫數字辨識、使用AlexNet。
✪OCR原理及實作、小波技術處理。
✪SVD、PCA、K-Means圖型壓縮原理。
✪圖型搜尋、比對、角點特徵偵測、Harris演算法、FAST演算法。
✪運動目標偵測、幀差分法、背景差分法、光流法。
✪浮水印技術、大腦影像分析、閾值分割、區域生長實作。
✪自動駕駛實作、包括環境感知、行為決策,路徑規劃及運動控制。
✪物件偵測,包括RCNN及YOLO。
✪視覺分析應用實例,包括Arcade Game製作,停車場自動車牌辨識系統開發。
作者簡介:
張德豐
佛山科學技術學院教授,主要從事智慧演算法、光電傳感等方面的科研與教學工作。
在國內外核心期刊上發表學術論文9篇,獲發明專利授權1項,實用新型專利授權4項。
主持和參與省部級、市級專案4項,課題涉及到電腦應用、自動控制、光學等領域。獲校級優秀青年教師獎、教學成果獎、教學評估優秀及教學品質獎等多個獎項。
出版《MATLAB R2017a模式識別》、《Python機器學習及實踐》、《TensorFlow深度學習及實踐》等書籍。
作者序
電腦視覺(Computer Vision,CV) 又稱為機器視覺(Machine Vision,MV)主是一門研究如何使機器「看」的科學,更進一步的說它是用來指用攝影機和電腦代替人眼對物件進行辨識、追蹤和測量等機器視覺,隨著社會科技的發展,用電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖型。
深度學習則來自經典的神經網路架構,屬於機器學習領域,它透過不同形式的神經網路,結合視覺巨量資料的大規模存量與不斷產生的增量進行訓練,自動提取細粒度的特徵,形成抽象化的視覺描述,在視覺分析方面取得很大的進步,是當前人工智慧爆炸性發展的核心驅動。就目前技術而言,電腦視覺可分為以下幾個大方向:
• 圖型分類
• 物件偵測
• 圖型分割
• 圖型重構
• 圖型生成
• 人臉
• 其他
隨著巨量資料及人工智慧技術的不斷發展,電腦視覺以其可視性、規模性、普適性逐步成為AI 實作應用的關鍵領域之一,在理論研究和工程應用上均迅速發展。
Python 是一種電腦程式語言,是一種物件導向的動態類型語言,它在設計上堅持了清晰劃一的風格,這使得Python 成為一門易讀、易維護,並且被大量使用者所歡迎的、用途廣泛的語言。隨著Python 版本的不斷更新和語言新功能的增加,越來越多被用於獨立的、大型專案的開發。自從20 世紀90 年代初Python 語言誕生至今,它已被逐漸廣泛應用於系統管理任務的處理和Web 程式設計。
自電腦誕生以來,透過電腦來模擬人類的視覺便成為非常熱門且頗具挑戰性的研究課題。隨著數位相機、智慧型手機等硬體裝置的普及,圖型以其易於擷取、資訊相關性多、抗干擾能力強的特點得到越來越廣泛的應用。
資訊化和數位化時代已經來臨,隨著對人工智慧領域的投入強度,電腦視覺處理的需求量也會越來越大,應用也將越來越廣泛。
因為Python 的好用、簡單、普遍等特性,所以本書的電腦視覺實現是在Python 完成,本書編寫特點主要表現在:
(1)案例涵蓋面廣、實用、擴充性、可讀性強。
本書以概述+ 案例的形式進行編寫,充分強調案例的實用性及程式的可擴充性,所選案例大多數來自日常生活中,應用性強。另外,書中每個案例的程式都經過偵錯與測試,同時程式碼中增加了大量的解釋說明,可讀性強。
(2)點面完美結合,兼顧性強。
本書點面兼顧,涵蓋了數位影像處理中幾乎所有的基本模組,並涉及視訊處理、對位拼接、數位浮水印等進階影像處理方面的內容,全面講解了基於Python 進行電腦視覺應用的原理及方法,內容做到完美連結與統籌兼顧,讓讀者實現了由點到面進行發散性延伸。
全書共20 章,每章節的主要內容包括:
第1 章介紹了電腦視覺程式設計基礎,主要包括電腦視覺的概述、Python程式設計軟體、幾個常用函數庫、Python 影像處理類別庫等內容。
第2 章介紹了去霧技術,主要包括空域圖型增強、時域圖型增強、色階調整去霧技術等內容。
第3 章介紹了形態學的去除雜訊,主要包括圖型去除雜訊的方法、數學形態學的原理、形態學運算等內容。
第4 章介紹了Hough 變換檢測,主要包括Hough 直線檢測、Hough 檢測圓等內容。
第5 章介紹了分割車牌定位辨識,主要包括車牌影像處理、定位原理、字元處理、字元辨識等內容。
第6 章介紹了分水嶺實現醫學診斷,主要包括分水嶺演算法、分水嶺醫學診斷案例分析等內容。
第7 章介紹了手寫數字辨識,主要包括卷積神經網路的概述、SVC 辨識手寫數字等內容。
第8 章介紹了圖片中英文辨識,主要包括OCR 的介紹、OCR 演算法原理、OCR 辨識經典應用、獲取驗證碼等內容。
第9 章介紹了小波技術的圖型視覺處理,主要包括小波技術的概述、小波實現去除雜訊、圖型融合處理等內容。
第10 章介紹了圖型壓縮與分割處理,主要包括SVD 圖型壓縮處理、PCA圖型壓縮處理、K-Means 聚類圖像壓縮處理等內容。
第11 章介紹了圖型特徵比對,主要包括相關概念、圖型比對等內容。
第12 章介紹了角點特徵檢測,主要包括Harris 的基本原理、Harris 演算法流程、Harris 角點的性質、角點檢測函數、FAST 特徵檢測等內容。
第13 章介紹了運動物件自動檢測,主要包括幀差分法、背景差分法、光流法等內容。
第14 章介紹了浮水印技術,主要包括浮水印技術的概念、數位浮水印技術的原理、典型的數位浮水印演算法、浮水印技術案例分析等內容。
第15 章介紹了大腦影像分析,主要包括閾值分割、區域生長、區域生長分割大腦影像案例分析等內容。
第16 章介紹了自動駕駛應用,主要包括理論基礎、環境感知、行為決策、路徑規則運動控制及自動駕駛案例分析等內容。
第17 章介紹了物件偵測,主要包括RCNN 系列、YOLO 檢測等內容。
第18 章介紹了人機互動,主要包括Tkinter GUI 程式設計元件、佈局管理器、事件處理、Tkinter 常用元件、選單等內容。
第19 章介紹了深度學習的應用,主要包括理論部分、AlexNet 網路及案例分析、CNN 拆分資料集案例分析等內容。
第20 章介紹了視覺分析綜合應用案例,主要包括越南大戰遊戲、停車場辨識費率系統等內容。
本書由佛山科學技術學院張德豐編寫。由於時間倉促,加之作者水準有限,所以錯誤和疏漏之處在所難免。在此,誠懇地期望得到各領域的專家和讀者們的批評指正,聯繫電子郵件workemail6@163.com。
張德豐
電腦視覺(Computer Vision,CV) 又稱為機器視覺(Machine Vision,MV)主是一門研究如何使機器「看」的科學,更進一步的說它是用來指用攝影機和電腦代替人眼對物件進行辨識、追蹤和測量等機器視覺,隨著社會科技的發展,用電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖型。
深度學習則來自經典的神經網路架構,屬於機器學習領域,它透過不同形式的神經網路,結合視覺巨量資料的大規模存量與不斷產生的增量進行訓練,自動提取細粒度的特徵,形成抽象化的視覺描述,在視覺分析方面取得很大的進步,是當前人工智慧爆炸性發展的核心驅...
目錄
1 電腦視覺程式設計基礎
1.1 電腦視覺的概述
1.2 Python 程式設計軟體
1.3 幾個常用函數庫
1.4 Python 影像處理類別庫
1.5 Matplotlib 函數庫
1.6 Numpy 影像處理
1.7 Scipy 影像處理
1.8 圖型降低雜訊
2 圖型去霧技術
2.1 空域圖型增強
2.2 時域圖型增強
2.3 色階調整去霧技術
2.4 長條圖均衡化去霧技術
3 形態學的去除雜訊
3.1 圖型去除雜訊的方法
3.2 數學形態學的原理
3.3 形態學運算
3.4 權重自我調整的多結構形態學去除雜訊
4 Hough 變換檢測
4.1 Hough 直線檢測
4.2 Hough 檢測圓
5 分割車牌定位辨識
5.1 基本概述
5.2 車牌影像處理
5.3 定位原理
5.4 字元處理
5.5 字元辨識
6 分水嶺實現醫學診斷
6.1 分水嶺演算法
6.2 分水嶺醫學診斷案例分析
7 手寫數字辨識
7.1 卷積神經網路的概述
7.2 SVC 辨識手寫數字
8 圖片中英文辨識
8.1 OCR 的介紹
8.2 OCR 演算法原理
8.3 OCR 辨識經典應用
8.4 獲取驗證碼
9 小波技術的圖型視覺處理
9.1 小波技術的概述
9.2 小波實現去除雜訊
9.3 圖型融合處理
10 圖型壓縮與分割處理
10.1 SVD 圖型壓縮處理
10.2 PCA 圖型壓縮處理
10.3 K-Means 聚類圖像壓縮處理
10.4 K-Means 聚類實現圖型分割
11 圖型特徵比對
11.1 相關概念
11.2 圖型比對
12 角點特徵檢測
12.1 Harris 的基本原理
12.2 Harris 演算法流程
12.3 Harris 角點的性質
12.4 Harris 檢測角點案例分析
12.5 角點檢測函數
12.6 Shi-Tomasi 角點檢測
12.7 FAST 特徵檢測
13 運動物件自動偵測
13.1 幀差分法
13.2 背景差分法
13.3 光流法
14 浮水印技術
14.1 浮水印技術的概念
14.2 數位浮水印技術的原理
14.3 典型的數位浮水印演算法
14.4 數位浮水印攻擊和評價
14.5 浮水印技術案例分析
15 大腦影像分析
15.1 閾值分割
15.2 區域生長
15.3 以閾值預分割為基礎的區域生長
15.4 區域生長分割大腦影像案例分析
16 自動駕駛應用
16.1 理論基礎
16.2 環境感知
16.3 行為決策
16.4 路徑規則
16.5 運動控制
16.6 自動駕駛案例分析
17 物件辨識
17.1 RCNN 系列
17.2 YOLO 檢測
18 人機互動
18.1 Tkinter GUI 程式設計元件
18.2 佈局管理器
18.3 事件處理
18.4 Tkinter 常用元件
18.5 選單
18.6 Canvas 繪圖
19 深度學習的應用
19.1 理論部分
19.2 AlexNet 網路及案例分析
20 視覺分析綜合應用案例
20.1 越南大戰遊戲
20.2 停車場辨識費率系統
參考文獻
1 電腦視覺程式設計基礎
1.1 電腦視覺的概述
1.2 Python 程式設計軟體
1.3 幾個常用函數庫
1.4 Python 影像處理類別庫
1.5 Matplotlib 函數庫
1.6 Numpy 影像處理
1.7 Scipy 影像處理
1.8 圖型降低雜訊
2 圖型去霧技術
2.1 空域圖型增強
2.2 時域圖型增強
2.3 色階調整去霧技術
2.4 長條圖均衡化去霧技術
3 形態學的去除雜訊
3.1 圖型去除雜訊的方法
3.2 數學形態學的原理
3.3 形態學運算
3.4 權重自我調整的多結構形態學去除雜訊
4 Hough 變換檢測
4.1 Hough 直線檢測
4.2 Hough 檢測圓
5 分割車...