購物比價找書網找車網
FindBook  
 有 7 項符合

網站擷取:使用Python 第二版

的圖書
網站擷取:使用Python 第二版 網站擷取:使用Python 第二版

作者:Ryan Mitchell / 譯者:楊尊一 
出版社:歐萊禮
出版日期:2018-10-09
語言:繁體書   
圖書介紹 - 資料來源:TAAZE 讀冊生活   評分:
圖書名稱:網站擷取:使用Python 第二版

內容簡介:在現代網路蒐集資料

「本書涵蓋的工具與範例,讓我輕易把好幾個重複的工作自動化,騰出時間解決更多有趣的問題。這是本重視成果、內容從實務問題與解法出發,又能很快讀完的好書。」
— Eric VanWyk, 電子計算機工程師,麻州歐林工程學院

如果程式設計是魔術,那麼網站擷取當然是一種魔法。你可以撰寫簡單的自動化程式查詢網頁伺服器、請求資料、並解析所需的資訊。本書不只介紹網頁擷取,還包含擷取各種現代網站資料的詳盡指南。

本書第一部份專注於網站擷取機制:使用Python從網頁伺服器取得資料、執行伺服器回應的基本處理工作、以及與網站的自動化互動。第二部分探索適用於不同擷取場景的各種工具與應用程式。

‧解析複雜HTML網頁
‧以Scrapy架構開發爬行程序
‧學習爬行資料的儲存方式
‧從文件讀取與提煉資料
‧清理格式不良的資料
‧以自然語言讀寫
‧透過表單與登入的爬行
‧JavaScript與API爬行
‧使用影像文字識別軟體
‧避開爬行陷阱與機器人阻擋程序
‧使用爬行程序測試你的網站

TOP

目錄
章節說明:前言

第一部 建構擷取程序
第一章 你的第一個擷取程序
第二章 進階HTML解析
第三章 撰寫網站爬行程序
第四章 網站爬行模型
第五章 Scrapy
第六章 儲存資料

第二部 儲存資料
第七章 讀取文件
第八章 清理髒資料
第九章 讀寫自然語言
第十章 表單與登入
第十一章 與擷取相關的JavaScript
第十二章 透過API 爬行
第十三章 影像處理與文字辨識
第十四章 避開擷取陷阱
第十五章 以爬行程序測試你的網站
第十六章 平行擷取網站
第十七章 遠端擷取
第十八章 網站擷取的法規與道德

索引
»看全部
TOP

商品資料
  • 作者: Ryan Mitchell 譯者: 楊尊一
  • 出版社: 美商歐萊禮股份有限公司台灣分公司 出版日期:2018-10-09 ISBN/ISSN:9789864769261
  • 語言:繁體中文 裝訂方式:平裝 頁數:280頁 開數:18K
  • 類別: 中文書> 電腦> 程式語言
贊助商廣告
 
 
金石堂 - 暢銷排行榜
請不要讓大人感到困擾!(03)完
作者:にやま
出版社:尖端漫畫
出版日期:2025-05-27
$ 119 
Taaze 讀冊生活 - 暢銷排行榜
自學日語 看完這本就能說:專為華人設計的日語教材,50音+筆順+單字+文法+會話一次學會!(附QR CODE音檔)
作者:許心瀠
出版社:語研學院
出版日期:2020-12-10
$ 374 
金石堂 - 暢銷排行榜
末世孤雄(02)
作者:増田ちひろ
出版社:青文出版社股份有限公司
出版日期:2025-05-14
$ 174 
金石堂 - 暢銷排行榜
變成吸血鬼的緩衝時間(全)
作者:柳瀬せの
出版社:東立出版社
出版日期:2025-06-30
$ 143 
 
金石堂 - 新書排行榜
新.朋友的馬麻(中) 無修正
作者:gonza
出版社:未來數位有限公司
出版日期:2025-05-02
$ 261 
博客來 - 新書排行榜
地獄犬對神官緊咬不放 1 (首刷限定版)
出版日期:2025-05-28
$ 170 
金石堂 - 新書排行榜
Domestic Beast—馴化的野獸—(全)
作者:ミナヅキアキラ
出版社:尖端漫畫
出版日期:2025-05-27
$ 128 
博客來 - 新書排行榜
難哄影集寫真:書衣紀念版(扉頁附印刷簽名)
出版日期:2025-06-02
$ 458 
 

©2025 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策