比Selenium還強大的網路爬蟲：Scrapy一本就精通-FindBook 找書網 ISBN:9789863796619

圖書名稱：比Selenium還強大的網路爬蟲：Scrapy一本就精通

本書說明目前最流行的Python 爬蟲架構Scrapy，它簡單好用、靈活易擴充、文件豐富、開發社區活躍，使用Scrapy 可以高效率地開發網路爬蟲應用。本書的讀者只需要有Python 語言基礎即可，我們從零基礎、逐步由淺入深說明。

全書共14章，系統地介紹Python流行框架Scrapy的相關技術及使用技巧。第1~8 章說明Scrapy 開發的核心基礎部分，重點介紹Scrapy的核心元素，如spider、selector、item、link等。

第9~14 章說明實際爬蟲開發中使用頻率最高的一些實用技術，如下載檔案和圖片、模擬登入、執行JavaScript、爬取動態網頁、使用HTTP代理、分散式爬蟲的編寫等內容。

本書主要特色：
■ 所有基礎部分的說明都配有程式範例，而不僅是枯燥的文件。
■ 案例選材方面以說明基礎知識為核心，儘量選擇專門供練習爬蟲技術的網站（不易變動）或接近日常生活的網站（京東、知乎、豆瓣、360）進行示範。
■ 在說明某些基礎知識時，對Scrapy原始程式進行分析，讓讀者能夠「知其然並知其所以然」。
適用：適合有一定Python語言基礎，想學習編寫複雜網路爬蟲的讀者。

作者簡介：

劉碩

曾任職知名外企，從事一線開發工作10年，目前主要從事Python開發與教學工作，在慕課網開設多門Python課程，深受學員歡迎。

作者序

前言

✤ 關於本書

如今是網際網路的時代，而且正在邁入智慧時代。人們早已意識到網際網路中的資料是有待開採的極大金礦，這些資料將改善我們的生活，網路爬蟲開發工作職位的出現和不斷增加正是以對資料價值為基礎的重視。優秀的爬蟲架構就像是開採金礦的強力採擷機，如果你能嫺熟地駕駛它們，就能大幅加強開採效率。

本書說明目前最流行的Python 爬蟲架構Scrapy，它簡單好用、靈活易擴充、文件豐富、開發社區活躍，使用Scrapy 可以高效率地開發網路爬蟲應用。本書的讀者只需要有Python 語言基礎即可，我們從零基礎、逐步由淺入深說明。第...

顯示全部內容

01 初識Scrapy
1.1 網路爬蟲是什麼
1.2 Scrapy 簡介及安裝
1.3 撰寫第一個Scrapy 爬蟲
1.4 本章小結

02 撰寫Spider
2.1 Scrapy 架構結構及工作原理
2.2 Request 和Response 物件
2.3 Spider 開發流程
2.4 本章小結

03 使用Selector 分析資料
3.1 Selector 物件
3.2 Response 內建Selector
3.3 XPath
3.4 CSS 選擇器
3.5 本章小結

04 使用Item 封裝資料
4.1 Item 和Field
4.2 擴充Item 子類別
4.3 Field 中繼資料
4.4 本章小結

05 使用Item Pipeline 處理資料
5.1 Item Pipeline
5.2 更多實例
5.3...

顯示全部內容