自動擷取資料、掌控網路資訊
網路上的資料浩瀚無涯,如果光靠人工方式收集整理資料,既煩瑣又浪費時間。與其沒完沒了的點擊每個頁面鏈結,何不讓網路機器人來為你代勞呢?
《網路機器人、網路蜘蛛與網路爬蟲》這本書教導你利用PHP/CURL建立簡單的程式,從網路無窮無盡的資料中挖出寶藏、解析資訊並妥善保存,以便讓你在資訊充足的情況下做出聰明的決策。本書的作者Michael Schrenk是一位受到高度推崇的網路機器人開發者,他會教你如何開發出具有容錯能力、能按時自動運行並具有以下功能的網路機器人:
.透過email或簡訊的發送,快速通知你最新的消息
.搜尋不同的資料來源並取得資料,然後整合到單一頁面中,讓你更容易進行解讀與分析。
.自動進行採購、進行拍賣競價,或是自動幫你進行其他網路活動,幫你省下更多的時間。
.以程式化的方式,自動下載整個網站
.有效解析出網頁中的資料
.對cookie進行管理
.對加密過的檔案進行解碼
.以自動化的方式提交表單
.自動收發電子郵件
《網路機器人、網路蜘蛛與網路爬蟲》第二版,還增加了一些高明的技巧,讓你能從本來難以取得資料的網站中順利取得資料。另外關於模仿人類行為、更高明的掩人耳目技巧、以及運用正規表示法解析資料的做法,也都包含在最新版本的內容之中。相信從網路機器人無限的可能性之中,你一定能發現更多節省寶貴時間、面對網路資料更輕鬆掌控的方法。
作者簡介
Michael Schrenk
從事網路機器人開發已經超過15年的時間了,從矽谷到莫斯科都有他的客戶,其中包括了 BBC、一些外國政府單位,還有其他許多名列財星500的大公司。他也經常在Decfcon發表演講,目前住在內華達州的拉斯維加斯。