圖書介紹 - 資料來源:博客來 目前評分: 評分:
圖書名稱:寫給程序員的數據挖掘實踐指南
內容簡介
數據挖掘一般是指從大量的數據中通過算法搜索隱藏於其中信息的過程。大多數數據挖掘的教材都專注於介紹理論基礎,因而往往難以理解和學習。 本書是介紹寫給程序員的一本數據挖掘指南,可以幫助讀者動手實踐進行數據挖掘、集體智慧並構建推薦系統。全書共8章,介紹了數據挖掘的基本知識和理論、協同過濾、內容過濾及分類、算法評估、朴素貝葉斯、非結構化文本分類以及聚類等內容。全書采用做中學的方式,用生動的圖示、大量的表格、簡明的公式,實用的Python代碼示例,闡釋數據挖掘的知識和技能。每章還給出了習題和練習,幫助讀者鞏固所學的知識。 本書專注適合對數據挖掘、數據分析和推薦系統感興趣的程序員及相關領域的從業者閱讀參考;同時,本書也可以作為一本輕松有趣的數據挖掘課程教學參考書。 Ron Zacharski是一名軟件開發工程師,曾在威斯康辛大學獲美術學士學位,之后還在明尼蘇達大學獲得了計算機科學博士學位。博士后期間,他在愛丁堡大學研究語言學。正是基於廣博的學識,他不僅在新墨西哥州立大學的計算研究實驗室工作,期間還接觸過自然語言處理相關的項目,而該實驗室曾被《連線》雜志評為機器翻譯研究領域翹楚。除此之外,他還曾教授計算機科學、語言學、音樂等課程,是一名博學多才的科技達人。
目錄
第1章 數據挖掘簡介及本書使用方法 1 歡迎來到21世紀 2 並不只是對象 5 TB級挖掘是現實不是科幻 7 本書體例 9 第2章 協同過濾—愛你所愛 14 如何尋找相似用戶 15 曼哈頓距離 16 歐氏距離 16 N維下的思考 18 一般化 22 Python中數據表示方法及代碼 24 計算曼哈頓距離的代碼 25 用戶的評級差異 28 皮爾遜相關系數 30 在繼續之前稍微休息一下 35 最后一個公式—余弦相似度 36 相似度的選擇 40 一些怪異的事情 43 k近鄰 44 Python的一個推薦類 47 一個新數據集 54 第3章 協同過濾—隱式評級及基於物品的過濾 56 隱式評級 57 調整后的余弦相似度 67 Slope One算法 76 Slope One算法的粗略描述圖 77 基於Python的實現 83 加權Slope One:推薦模塊 88 MovieLens數據集 90 第4章 內容過濾及分類—基於物品屬性的過濾 93 一個簡單的例子 98 用Python實現 101 給出推薦的原因 102 一個取值范圍的問題 104 歸一化 105 改進的標准分數 109 歸一化 vs. 不歸一化 111 回到Pandora 112 體育項目的識別 119 Python編程 123 就是它了 133 汽車MPG數據 135 雜談 137 第5章 分類的進一步探討—算法評估及kNN 139 訓練集和測試集 140 10折交叉驗證的例子 142 混淆矩陣 146 一個編程的例子 148 Kappa統計量 154 近鄰算法的改進 159 一個新數據集及挑戰 163 更多數據、更好的算法以及一輛破公共汽車 168 第6章 概率及朴素貝葉斯—朴素貝葉斯 170 微軟購物車 174 貝葉斯定理 177 為什麼需要貝葉斯定理 185 i100 i500 188 用Python編程實現 191 共和黨 vs. 民主黨 197 數字 205 Python實現 214 這種做法會比近鄰算法好嗎 221 第7章 朴素貝葉斯及文本—非結構化文本分類 226 一個文本正負傾向性的自動判定系統 228 訓練階段 232 第8章 聚類—群組發現 256 k-means聚類 281 SSE或散度 289 小結 303 安然公司 305
詳細資料
ISBN:9787115336354規格:309頁 / 普通級 / 1-1 出版地:大陸
作者:許添盛
出版社:賽斯文化
出版日期:2016-07-01
66折: $ 660
作者:許添盛醫師主講
出版社:賽斯文化
出版日期:2019-05-06
66折: $ 660
作者:潔絲慕音
出版社:橡實
出版日期:2017-05-15
66折: $ 851
作者:陳嘉珍
出版社:賽斯文化
出版日期:2017-03-10
66折: $ 634
$ 592
作者:張忠謀
出版社:遠見天下文化出版股份有限公司
出版日期:2024-11-29
$ 869
作者:門馬司
出版社:尖端漫畫
出版日期:2025-01-14
$ 170
作者:甘詰留太
出版社:青文出版社股份有限公司
出版日期:2025-01-20
$ 111
作者:渦井
出版社:東立出版社
出版日期:2025-02-28
$ 133
作者:龍牙翔
出版社:紳士出版
出版日期:2025-01-23
$ 220
作者:藤子.F.不二雄
出版社:青文出版社股份有限公司
出版日期:2025-01-15
$ 126
$ 97