圖像搜尋引擎有兩種實現方式—基於圖像上下文文字特徵的方式和基於圖像視覺內容特徵的方式。本書所指的圖像搜尋引擎是基於內容特徵的圖像檢索,也就是「以圖搜圖」來檢索相似圖片。本書主要講解搜尋引擎技術的發展脈絡、文字搜尋引擎的基本原理和搜尋引擎的一般結構,詳細講述圖像搜尋引擎各主要組成部分的原理和實現,並構建一個基於深度學習的Web圖像搜尋引擎。
本書首先介紹圖像搜尋引擎的相關理論和實現方法,結合具體的Java程式碼實例解釋理論,展示從文字搜尋演進到圖像搜尋的技術路徑。最後會帶領讀者逐步實現一個AI圖像搜尋引擎,使讀者不僅理解相關理論,而且具備實際的開發能力。
本書主要內容:
■ 從文字搜索到影像搜索
■ 傳統影像特徵分析
■ 深度學習影像特徵分析
■ 影像特徵索引與檢索
■ 建置一個以深度學習為基礎的Web 影像搜尋引擎
適合讀者群:對圖像搜尋引擎有興趣的開發者、程式設計師、演算法工程師,或機器視覺等相關領域工作者,也適合作為大專院校相關科系師生參考用書。
本書特色
➢以深度學習Web圖像搜尋引擎為基礎
➢講解圖像搜尋引擎的原理和實現
➢帶領讀者從零開始掌握圖像檢索技術
作者簡介:
明恒毅
軟體工程師。從事資訊系統的設計、開發、管理、運維工作,擅長影像處理、圖像檢索、搜尋引擎、深度學習等領域的理論與技術應用實踐,熱衷研究前端軟體技術。
曾在其主持研發的視訊監控檢索系統、融合通信智慧應答系統等專案中,積極運用AI技術,獲得良好成效。
作者序
大約十年前的某一天,我正徜徉在網際網路的世界裡,忽然一個名叫"TinEye" 的影像搜尋引擎網站映入我的眼簾。我滿懷憧憬地在那個網站中上傳了一幅圖片,它很快搜索並傳回了許多這幅圖片在網際網路中不同URL 上的結果。我接著嘗試上傳了另一幅圖片,一會兒它又傳回了許多近似這幅圖片的結果,很顯然,結果中的很多圖片是在同一幅影像上修改的。面對如此準確和令人驚豔的結果,我不禁腦洞大開、浮想聯翩,構思著一個個可以運用該技術實現的奇思妙想。猛然間,我覺得心中產生了一股強大的力量 -- 我要弄清楚它背後的技術原理。
為了徹底弄清楚這種別圖像搜尋引擎的技術原理,我反覆尋找和閱讀當時網際網路上甚為缺乏的相關資料,但收效甚微。直到後來,我遇到了一個叫作LIRE 的開放原始碼專案,它讓我初步了解影像搜尋引擎的技術原理。但是在實際應用中,LIRE 的效果並不是太好。為了解決這個問題,我又找到「深度學習」這個強有力的幫手。在探索原理的過程中,我發現幾乎找不到一本介紹影像搜尋引擎基本原理和實現的中文書,這也成了本書誕生的緣由。
以內容為基礎的影像檢索技術自20 世紀90 年代提出以來,獲得了迅速的發展。研究人員提出了不同的理論和方法,其中具有代表性的是SIFT、詞袋模型、向量量化、倒排索引、局部敏感雜湊、旋積神經網路,等等。與此同時,產業界也推出了許多實用的影像搜尋引擎,例如TinEye、Google 影像搜索、百度影像搜索和以淘寶為代表的垂直領域影像搜尋引擎。但是到目前為止,此項技術還遠未完全成熟,還有許多問題需要解決,改進和加強的空間還很大。搜索的結果和使用者的期望還有一些距離,存在一定的影像語義鴻溝。這也是從事這項技術研究與開發的人員不斷進步的源動力。
希望本書的出版能夠在某種程度上緩解影像搜尋引擎資料稀少的現狀,並能夠吸引和幫助更多的技術人員關注並研究影像檢索技術。
明恒毅
大約十年前的某一天,我正徜徉在網際網路的世界裡,忽然一個名叫"TinEye" 的影像搜尋引擎網站映入我的眼簾。我滿懷憧憬地在那個網站中上傳了一幅圖片,它很快搜索並傳回了許多這幅圖片在網際網路中不同URL 上的結果。我接著嘗試上傳了另一幅圖片,一會兒它又傳回了許多近似這幅圖片的結果,很顯然,結果中的很多圖片是在同一幅影像上修改的。面對如此準確和令人驚豔的結果,我不禁腦洞大開、浮想聯翩,構思著一個個可以運用該技術實現的奇思妙想。猛然間,我覺得心中產生了一股強大的力量 -- 我要弄清楚它背後的技術原理。
為了徹底弄清...
目錄
01從文字搜索到影像搜索
1.1 文字搜尋引擎的發展
1.2 文字搜尋引擎的結構與實現
1.3 搜尋引擎的一般結構
1.4 從文字到影像
1.5 現有影像搜尋引擎介紹
1.6 本章小結
02傳統影像特徵分析
2.1 人類怎樣取得和了解一幅影像
2.2 電腦怎樣取得和表示一幅影像
2.3 影像特徵的分類
2.4 全域特徵
2.5 局部特徵
2.6 本章小結
03深度學習影像特徵分析
3.1 深度學習
3.2 深度學習應用架構
3.3 旋積神經網路
3.4 本章小結
04影像特徵索引與檢索
4.1 影像特徵降維
4.2 影像特徵標準化
4.3 影像特徵相似度的度量
4.4 影像特徵索引與檢索
4.5 本章小結
05建置一個以深度學習為基礎的
Web 影像搜尋引擎
5.1 架構分析與技術路線
5.2 程式實現
5.3 最佳化策略
5.4 本章小結
01從文字搜索到影像搜索
1.1 文字搜尋引擎的發展
1.2 文字搜尋引擎的結構與實現
1.3 搜尋引擎的一般結構
1.4 從文字到影像
1.5 現有影像搜尋引擎介紹
1.6 本章小結
02傳統影像特徵分析
2.1 人類怎樣取得和了解一幅影像
2.2 電腦怎樣取得和表示一幅影像
2.3 影像特徵的分類
2.4 全域特徵
2.5 局部特徵
2.6 本章小結
03深度學習影像特徵分析
3.1 深度學習
3.2 深度學習應用架構
3.3 旋積神經網路
3.4 本章小結
04影像特徵索引與檢索
4.1 影像特徵降維
4.2 影像特徵標準化
4.3 影像特徵相似度的度量
4....