購物比價找書網找車網
FindBook  
 有 4 項符合

飼育網路爬蟲:搜尋引擎資料探勘最佳化

的圖書
飼育網路爬蟲:搜尋引擎資料探勘最佳化 飼育網路爬蟲:搜尋引擎資料探勘最佳化

作者:王亮 
出版社:佳魁資訊股份有限公司
出版日期:2012-07-30
語言:繁體書   
圖書介紹 - 資料來源:TAAZE 讀冊生活   評分:
圖書名稱:飼育網路爬蟲:搜尋引擎資料探勘最佳化

本書作者是一位資深的搜尋引擎開發人員,作者對資料獲取(網路資訊挖掘)與資料檢索(搜尋引擎)兩方面作了深入的介紹。本書首先提出了一套「網路資料採擷」的完整理論,並舉出一個實際的智慧爬蟲系統,透過理論與實際的完整呈現,使讀者能夠對「網路資料採擷」有一個比較具體的認識,然後介紹了一個專用程式語言IRS,並舉出了這個語言的編譯器以及虛擬機器的實現方法。
本書還透過對多個開放原始碼搜尋引擎項目抽絲剝繭的細緻分析,引出搜尋引擎的一些基本原理與開發方法,並介紹一個商業化搜尋引擎的實例;最终還結合一個Java框架介紹一些軟體設計思想。
希望本書能對搜尋引擎開發人員有所啟發,幫助那些對搜尋引擎開發有興趣的讀者踏進這扇大門,並為那些經驗不那麼豐富的搜尋引擎開發者提供一些參考,使得廣大網際網路使用者能在Google 和Baidu 之外的眾多的垂直搜索網站上獲得更好的體驗與服務。從初學者到有一定經驗的搜尋引擎開發人員,各個層次的讀者都能找到一些適合自己閱讀的章節。


目錄
第1章 網頁資料採擷
1.1 網頁資料採擷定義
1.2 Web 資料採擷面臨的問題
1.3 Web 資料採擷的分類
1.4 網頁資料的結構與特點
1.5 網頁資料採擷的基本方法

第2章 智慧型網路爬蟲
2.1 智慧型網路爬蟲的定義與特點
2.2 抓取入口定義
2.3 次級頁面自動發現
2.4 次級頁面位址拼接
2.5 已爬位址處理
2.6 資訊採集強度控制
2.7 模擬使用者登入
2.8 驗證碼識別
2.9 代理伺服器設置
2.10 JavaScript 解析控制

第3章 網頁資訊挖掘專用程式設計語言IRS
3.1 IRS 語言的簡介與設計原則
3.2 IRS 腳本語...
»看全部

商品資料
  • 作者: 王亮
  • 出版社: 佳魁資訊股份有限公司 出版日期:2012-07-30 ISBN/ISSN:9789866007941
  • 語言:繁體中文 裝訂方式:平裝 頁數:416頁
  • 類別: 中文書> 電腦> WWW
贊助商廣告
 
金石堂 - 今日66折
牛津通識課宇宙篇套書(四冊):《重力》、《行星》、《光》、《黑洞》
作者:提姆西.克里夫頓
出版社:日出出版
出版日期:2021-08-02
66折: $ 845 
金石堂 - 今日66折
盆栽急診室:葉子變黃、掉葉、病蟲害、換盆、修剪分枝,百年園藝老店繼承人的綠手指養護祕笈。
作者:川原伸晃
出版社:大是文化有限公司
出版日期:2024-05-28
66折: $ 304 
金石堂 - 今日66折
這是一個好問題2:那會怎麼樣承認未知事物,然後想像可能答案,是所有科學探索的開始。
作者:李淼
出版社:任性出版有限公司
出版日期:2023-11-28
66折: $ 257 
 
金石堂 - 暢銷排行榜
隨插即上!性愛後宮 無修正 ※DAV
作者:西沢水木(西沢みずき)
出版社:未來數位有限公司
出版日期:2024-10-30
$ 253 
金石堂 - 暢銷排行榜
明天可能會愛你(02)
作者:山下街
出版社:青文出版社股份有限公司
出版日期:2024-11-04
$ 111 
博客來 - 暢銷排行榜
敗北女角太多了! 7 (首刷限定版)
作者:雨森焚火
出版社:東立
出版日期:2024-10-08
$ 252 
Taaze 讀冊生活 - 暢銷排行榜
miffy潔膚柔濕巾-10抽(橘)
作者:新台
出版社:新台圖書
出版日期:2023-08-30
$ 18 
 
金石堂 - 新書排行榜
多謝款待:那些愛與被愛的煙火氣
作者:張曼娟
出版社:皇冠文化出版有限公司
出版日期:2024-11-04
$ 300 
金石堂 - 新書排行榜
東京黑盒子(01)
作者:しもはら
出版社:青文出版社股份有限公司
出版日期:2024-11-04
$ 221 
Taaze 讀冊生活 - 新書排行榜
山茶花情書【山茶花文具店․再次與你相逢】
作者:小川糸
出版社:圓神出版社有限公司
出版日期:2024-11-01
$ 277 
博客來 - 新書排行榜
一念心 改寫神的劇本《隨書附贈「姻緣、旺財、平安三金牌」》
作者:黃子芸
出版社:宇河文化出版有限公司
出版日期:2024-11-08
$ 284 
 

©2024 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策