本書作者是一位資深的搜尋引擎開發人員,書中對資料獲取(網路資訊挖掘)與資料檢索(搜尋引擎)兩個方面作了深入的介紹。本書首先提出了一套“網路資料採擷”的完整理論,並舉出一個實際的智慧爬蟲系統,透過理論與實際的完整呈現,使讀者能夠對“網路資料採擷”有一個比較具體的認識,然後介紹了一個專用程式語言IRS,並舉出了這個語言的編譯器以及虛擬機器的實現方法。
本書還透過對多個開放原始碼搜尋引擎項目抽絲剝繭的細緻分析,引出搜尋引擎的一些基本原理與開發方法,並介紹一個商業化搜尋引擎的實例;最終還結合一個Java框架介紹一些軟體設計思想。
本書適合搜尋引擎開發人員作為參考,也適合有一定電腦基礎的讀者閱讀,以擴充視野。從初學者到有一定經驗的搜尋引擎開發人員,各個層次的讀者都能找到一些適合自己閱讀的章節。