購物比價找書網找車網
FindBook  
 有 5 項符合

LLM × 網路爬蟲終極實戰:n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent

的圖書
LLM × 網路爬蟲終極實戰:n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent【金石堂、博客來熱銷】 LLM × 網路爬蟲終極實戰:n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent【金石堂、博客來熱銷】

作者:陳會安 
出版社:旗標科技股份有限公司
出版日期:2025-11-27
圖書介紹 - 資料來源:TAAZE 讀冊生活   評分:
圖書名稱:LLM × 網路爬蟲終極實戰:n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent

身處 LLM 時代的必備技能

AI 爬蟲與資料檢索的全本機工作流


你還在用傳統的方法爬取網路資料嗎?
還在手動分析 HTML 網頁結構、逐一定位網頁元素、再手刻爬蟲程式嗎?

身處 AI 世代,是時候該學習更聰明、更高效的資料收集方法,
讓你坐在電腦前,喝著咖啡、悠閒地看著 AI 為你自動爬取網路資料。

在 AI 飆速發展的今天,傳統網路爬蟲技術正迎來全新的變革。
過去,Python 爬蟲程式的開發者必須自行剖析 HTML 網頁結構,撰寫繁瑣複雜的資料擷取規則與步驟;如今,隨著 LLM 的普及,AI 已能協助我們理解 HTML 網頁結構、定位網頁資料,甚至能夠自動化建立整個爬取流程,大幅提升開發效率。

本書從 HTML 結構解析入門,循序講解 BeautifulSoup + CSS 選擇器、lxml + XPath 表達式、正規表達式等核心技術,再深入 Selenium 模擬瀏覽器互動及 Scrapy 爬蟲框架的專業應用,帶領讀者全面掌握靜態與動態網頁擷取技術。更進一步結合 Playwright 自動化瀏覽器、以及 AI 驅動的爬蟲框架 Crawl4AI 和 ScrapeGraphAI,讓 LLM 成為理解與提取網頁資料的主力。

不只如此,本書採用 n8n × Ollama 全本機架構,無需 API Key、無需 Docker,即可整合 SearXNG 搜尋引擎、Crawl4AI API 資料爬取、Qdrant 向量資料庫與 RAG 知識檢索生成,最終打造出 MCP + AI Agent 自動化流程 ⸺ 從搜尋、爬取到資料處理與知識生成一手包辦!
本書特色:
用 AI 分析 HTML 結構建立 Python 網路爬蟲
▸全面掌握靜態與動態 HTML 網頁擷取技術,CSS Selector、XPath 一次上手
▸實戰演練 BeautifulSoup、Selenium、Scrapy 經典 Python 爬蟲框架

Python × LLM 建立 AI 網路爬蟲
▸整合 OpenAI、Gemini、Groq、Ollama 等多種 LLM,打造智慧爬蟲系統
▸運用 AI 驅動的爬蟲技術 Crawl4AI 與 ScrapeGraphAI,自動理解並提取網頁內容
▸結合非同步程式設計,提升資料抓取效率與彈性

整合 Python × AI 網路爬蟲的 AI 工作流程:n8n
▸以視覺化介面建立自動化流程,輕鬆整合搜尋、爬取與資料處理
▸結合 Qdrant 向量資料庫 × RAG 技術,打造個人化知識檢索系統
▸構建全本機 AI Agent 工作流,實現從資料擷取到生成的自動化流程

作者簡介:

陳會安
學歷:美國猶他州州立大學電腦碩士
經歷:多所大專院校企業講師、松崗電腦產品經理、美商 PH 出版經理、專業電腦書作者

國內知名資訊技術作家,已出版逾 100 本電腦著作,包括:程式設計、網頁設計、資料庫、系統分析、資料結構等各種不同主題。近年研究人工智慧、機器學習 / 深度學習、資料科學、網路爬蟲、大數據分析和物聯網相關課程與圖書寫作,也熱衷利用 Raspberry Pi、Arduino、ESP8266 / ESP32 和 Micro:bit 等開發板製作創客作品,投入創客領域的教學與寫作。

目錄
▌第 1 章 HTML、JSON 與網路爬蟲的基礎
1-1 網路爬蟲的基礎
1-2 網路爬蟲的相關技術
1-3 HTML 標籤語法與結構
1-4 CSV 與 JSON
1-5 Python × AI 網路爬蟲的相關函式庫

▌第 2 章 從網路取得資料
2-1 認識 HTTP 標頭與 httpbin.org 服務
2-2 使用 Requests 送出 HTTP 請求
2-3 取得 HTTP 回應內容
2-4 送出進階的 HTTP 請求
2-5 錯誤 / 例外處理與檔案存取

▌第 3 章 擷取靜態 HTML 網頁資料
3-1 在 HTML 網頁定位目標資料
3-2 使用 BeautifulSoup 剖析 HTML 網頁
3-3 分析靜態 HTML 網頁
3-4 使用 find() 函式搜尋...
顯示全部內容
贊助商廣告
 
金石堂 - 今日66折
一笑妖嬈傾天下(一)
作者:莫言殤
出版社:東佑文化事業有限公司
出版日期:2016-12-14
66折: $ 165 
金石堂 - 今日66折
娘子你別太囂張(下)完
作者:夜初
出版社:東佑文化事業有限公司
出版日期:2013-03-22
66折: $ 165 
金石堂 - 今日66折
家養小首輔(四)
作者:假面的盛宴
出版社:東佑文化事業有限公司
出版日期:2019-06-06
66折: $ 165 
金石堂 - 今日66折
花田柴米妻(三)
作者:夜纖雪
出版社:東佑文化事業有限公司
出版日期:2016-11-23
66折: $ 165 
 
Taaze 讀冊生活 - 暢銷排行榜
Taiwan Travelogue
作者:Yang, Shuang-zi/ King, Lin(tr.)
出版社:St. Martin's P.
出版日期:2024-11-12
$ 497 
金石堂 - 暢銷排行榜
自從與你相遇之後(全)
作者:吉井ハルアキ
出版社:尖端漫畫
出版日期:2026-06-09
$ 136 
金石堂 - 暢銷排行榜
名偵探柯南(107)特別版
作者:青山剛昌
出版社:青文出版社股份有限公司
出版日期:2026-06-03
$ 379 
金石堂 - 暢銷排行榜
水邊對抗(全)
作者:はっせん
出版社:青文出版社股份有限公司
出版日期:2026-06-15
$ 260 
 
Taaze 讀冊生活 - 新書排行榜
伊利亞德:荷馬史詩故事I【倫敦大學教授精心詮釋,新古典藝術大師繪製插圖,最受歡迎的希臘神話經典】
作者:荷馬原著、阿爾弗雷德.約翰.丘奇改寫
出版社:有理文化
出版日期:2026-06-10
$ 245 
金石堂 - 新書排行榜
於白月之夜 (上+下) 特裝版
作者:渋江ヨフネ
出版社:長鴻出版社股份有限公司
出版日期:2026-06-23
$ 670 
金石堂 - 新書排行榜
既然你都這麼說了我就抱你吧(03)
作者:にやま
出版社:尖端漫畫
出版日期:2026-06-16
$ 136 
Taaze 讀冊生活 - 新書排行榜
2027【必備衝刺題庫書】流體力學與流體機械重點統整+高分題庫〔六版〕(國民營/經濟部/中鋼/高普地特/專技高考)
作者:林柏超
出版社:千華數位文化股份有限公司
出版日期:2026-05-25
$ 459 
 

©2026 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策