本書通過紮實、詳細的內容,從理論知識、算法源碼、實驗結果等方面對深度學習中涉及的算法進行分析和介紹。本書共三篇,第一篇主要介紹深度學習在目標檢測與分割方向的前沿算法,包括雙階段檢測、單階段檢測、無錨點檢測、特徵融合、損失函數、語義分割這6個方向;第二篇主要介紹深度學習在場景文字檢測與識別方向的重要突破,主要介紹場景文字檢測、場景文字識別這兩個階段的算法;第三篇主要介紹深度學習的其他算法與應用,包括圖像翻譯、圖神經網絡、二維結構識別、人像摳圖、圖像預訓練、多模態預訓練這6個方向的算法。附錄部分介紹雙線性插值、匈牙利算法、Shift-and-Stitch、德勞內三角化、圖像梯度、仿射變換矩陣等內容。
本書結構清晰,內容廣度與深度齊備。通過閱讀本書,讀者可以了解前沿的深度學習算法,擴展自己的算法知識面。無論是從事深度學習科研的教師及學生,還是從事算法落地實踐的工作人員,都能從本書中獲益。
劉岩,曾先後就讀於重慶大學軟件工程專業和澳門大學計算機科學專業,分別獲得學士和碩士學位,期間發表多篇論文。目前就職于京東零售技術研發與數據中心,主要負責電商場景下的基礎算法研究以及內容風控業務,包括風險輿情監控和挖掘、風險電商內容的發現和治理等。擅長前沿人工智能算法的原理分析和落地,先後參與並負責了深度學習多個算法在業務上的落地,例如OCR、公式識別、手勢識別、視頻摳像、文本分類,預訓練詞向量模型、語言識別、圖神經網絡等。知乎賬號:大師兄。