購物比價找書網找車網
FindBook  
 有 8 項符合

Python資料分析必備套件!Pandas資料清理、重塑、過濾、視覺化

的圖書
Python資料分析必備套件!Pandas資料清理、重塑、過濾、視覺化 Python資料分析必備套件!Pandas資料清理、重塑、過濾、視覺化

作者:Matt HarrisonTheodore Petrou / 譯者:蔣佑仁李侑穎 
出版社:旗標科技股份有限公司
出版日期:2021-11-26
語言:繁體書   
圖書介紹 - 資料來源:TAAZE 讀冊生活   評分:
圖書名稱:Python資料分析必備套件!Pandas資料清理、重塑、過濾、視覺化

【最齊全!徹底活用Pandas的114技】

想學Pandas,看官方文件就夠了?
對於Python使用者來說,Pandas無疑是資料分析的必備套件。有了Pandas,您可以非常高效地重塑、過濾、清理以及整合大部分類型的資料。的確,Pandas的官方網站提供了不同指令的使用範例。因此有的使用者會說:『不用買書看啦!網路資源這麼豐富,多看看官方文件就好了!』

不過,單單只知道某個指令的運作方式是不足夠的。在實際進行資料分析時,您可能需要結合多個指令來達成目標。這時候,您更需要知道如何活用Pandas。舉例來說,假設您現在面對DataFrame的記憶體用量過大,導致無法順利分析資料的難題時,該怎麼辦呢?

從Pandas的官方文件中,您可以了解轉換欄位型別的方法,也知道如何查詢欄位的浮點數精度。只要結合這兩個方法,您就可以非常輕鬆地降低DataFrame的記憶體用量。遺憾的是,官方文件並不會告訴您這個訣竅,而必須自己花時間來摸索。在摸索的過程中,不可避免地會多走許多彎路。

本書並非單純的Pandas語法參考手冊。作者寫作此書時的目標,是希望讀者們可以從完整的範例中學習,並充分了解活用Pandas技巧的重要性。此外,作者習慣給出同一問題的不同解法,同時比較不同做法的效能。由此一來,讀者日後在實際分析資料時,才能知道哪一種做法是最優解。

正面對決真實資料集!
目前市面上的Pandas書籍,多數是使用亂數產生的假資料集來進行教學。這會導致您在面對真實資料集時,不知該從何下手。有鑒於此,本書作者使用了眾多的真實資料集,讓讀者切身感受資料分析師的工作內容。書中的資料集包含:
●IMDB 5000電影資料集
●Tesla股票資料集
●Kaggle問卷資料集
●鑽石品質資料集
●美國大學資料集
●美國國內航班資料集
●丹佛市的犯罪案件資料集
●阿爾塔年積雪資料集
●美國燃油經濟資料集
…等

最齊全的Pandas技巧教學!
為了讓讀者可以更好的理解,書中每一小節的內容皆搭配完整範例。讀者可以從讀入資料集開始,循序漸進地搞懂資料分析的眉眉角角。全書共傳授了Pandas實戰的114種技巧,保證讀者可以全面掌握其中的精髓。讀者將會學到如何:
●處理資料集中的缺失值
●處理索引爆炸的問題
●組合多個Pandas物件
●在DataFrame中新增和刪除欄位
●取得特定欄位的統計資訊
●轉置DataFrame的運算方向
●減少DataFrame的記憶體用量
●混用位置和標籤來選取資料
●透過Pandas實現SQL的功能
●對多個欄位進行分組及聚合運算
●將資料集重塑成整齊的形式
●過濾包含時間序列資料的欄位
●搭配Matplotlib和Seaborn來視覺化資料
●在Jupyter中進行Pandas程式碼的除錯
…等

如果您不想只是死記硬背Pandas語法,還想學習如何活用其中的技巧,非常歡迎您跟著書中的範例動手試試看,保證可以讓您的資料分析能力更上一層樓!
本書特色:
●全面採用最新的Pandas 1.x版本
●最齊全的Pandas教學,傳授114招實用技巧
●附有超過114個範例,還有多到無法細數的資料分析的寶貴經驗,從做中學才更有效
●使用真實世界中的資料集,累積實戰能力
●搭配NumPy、Matplotlib、Seaborn、 Pandarallel、Great Expectations、pytest、Hypothesis 等工具,擴增你的武器庫
●完整說明CSV檔、JSON檔、SQL資料及HTML表格等資料類型的載入方式
●本書由施威銘研究室監修,書中針對原書進行大量補充,並適當添加註解,幫助讀者更好地理解內容

作者簡介:

Matt Harrison 自 2000 年起就開始使用 Python。他是 MetaSnake 的經營者,專門提供 Python 和資料科學的企業培訓服務。他也是《Machine Learning Pocket Reference》、《Illustrated Guide to Python 3》以及《Learning the Pandas Library》等暢銷書的作者。

Theodore Petrou 是一名資料科學家,也是 Dunder Data(一家深耕於探索性資料分析的專業教育公司)的創辦人。同時,他是 Houston Data Science 的負責人。Houston Data Science 是一個擁有超過 2000 名成員的聚會群組,主要目標是讓當地的資料愛好者一起精進資料科學。在創辦Dunder Data 前,Ted 是 Schlumberger(一家大型石油服務公司)的資料科學家。在那裡,他花費了大部分時間來探索資料。

目錄
☆第0章:Pandas 套件的基礎
0-1 DataFrame物件
0-2 DataFrame的屬性(attributes)
0-3 Series物件
0-4 Pandas中的資料型別

☆第1章:DataFrame及Series的基本操作
1-1 選取DataFrame的欄位
1-2 呼叫Series的方法(method)
1-3 Series的相關操作
1-4 串連Series的方法
1-5 更改欄位名稱
1-6 新增及刪除欄位

☆第2章:DataFrame的運算技巧
2-1 選取多個DataFrame的欄位
2-2 用方法選取欄位
2-3 對欄位名稱進行排序
2-4 DataFrame的統計方法
2-5 串連DataFrame的方法
2-6 DataFrame的算符運算
2-7 比較缺失值
2...
顯示全部內容
贊助商廣告
 
 
Taaze 讀冊生活 - 暢銷排行榜
世界上最透明的故事(日本出版界話題作,只有紙本書可以體驗的感動)
作者:杉井光
出版社:皇冠文化出版有限公司
出版日期:2024-09-30
$ 284 
Taaze 讀冊生活 - 暢銷排行榜
被討厭的勇氣:自我啟發之父「阿德勒」的教導
作者:岸見一郎、古賀史健
出版社:究竟出版
出版日期:2014-10-30
$ 237 
金石堂 - 暢銷排行榜
Kiss me crying-吻我落淚-(02)特典版
作者:Arinco
出版社:青文出版社股份有限公司
出版日期:2024-11-06
$ 126 
金石堂 - 暢銷排行榜
四季姊妹 無修正
作者:あきのそら
出版社:未來數位有限公司
出版日期:2024-10-30
$ 253 
 
博客來 - 新書排行榜
張忠謀自傳全集(上下冊)
$ 869 
博客來 - 新書排行榜
我在意的對象並不是男人 (2) 特裝版 【含角川&博客來限定小卡】
作者:新井すみこ
出版社:台灣角川
出版日期:2025-02-06
$ 750 
Taaze 讀冊生活 - 新書排行榜
味覺獵人:舌尖上的科學與美食癡迷症指南
作者:芭柏.史塔基
出版社:漫遊者文化
出版日期:2024-11-11
$ 336 
金石堂 - 新書排行榜
失憶投捕 06
作者:美川絵子
出版社:東立出版社
出版日期:2024-12-31
$ 105 
 

©2024 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策