用PANDAS、NUMPY和IPYTHON做資料分析
『本書已是Python資料生態圈的經典之作。這個新版本更新了從Python 3.6到最新版pandas功能,這些關鍵領域的更新更增加本書價值。透過說明為何使用Python資料工具的原因和用法,協助讀者以全新及富創意的方法,學會如何有效率的使用它們。書中的概念對任何資料密集計算的現代函式庫都很重要。』
—Fernando Pérez
Statistics, UC Berkeley統計學助理教授
IPython以及Jupyter專案創立人
內含操作、處理、清理和處理資料集合的完整Python指引。本書第二版已更新至Python3.6版,新增收錄許多實用學習範例,讓你看到如何有效率解決資料分析問題。在過程中你會學到最新版本pandas、NumPy和IPython及Jupyter。
本書由Python pandas專案創立人Wes McKinny所著,是一本實用又現代的資料科學Python工具書,對於剛接觸Python的分析人員,或是新接觸資料科學和科學計算的Python工程師而言,本書是理想的選擇。相關資料檔案和材料均能在GitHub上取得。
‧使用IPython shell和Jupyter Notebook進行探索性計算
‧學習NumPy(Numberical Python)基礎與進階功能
‧開始使用pandas函式庫中的資料分析工具
‧使用有彈性的工具進行載入、清理、轉換、合併與重新塑造資料
‧應用pandas的groupby功能,對資料集進行切片、切塊和彙整
‧分析和操作規律與無規律的時間序列資料
‧利用全面、詳細的範例學習如何解決真實世界的資料分析問題
目錄
第一章 寫在前面
第二章 Python基礎、IPython 和Jupyter notebook
第三章 內建資料結構、函式和檔案
第四章 NumPy基礎:陣列和向量化計算
第五章 使用pandas
第六章 資料載入、儲存和檔案格式
第七章 資料整理和前處理
第八章 資料處理:連接、合併和重塑
第九章 繪圖與視覺化
第十章 資料聚合和分組
第十一章 時間序列
第十二章 pandas進階
第十三章 Python中的建模函式庫
第十四章 資料分析範例
附錄A 深入NumPy
附錄B 關於IPython系統
第一章 寫在前面
第二章 Python基礎、IPython 和Jupyter notebook
第三章 內建資料結構、函式和檔案
第四章 NumPy基礎:陣列和向量化計算
第五章 使用pandas
第六章 資料載入、儲存和檔案格式
第七章 資料整理和前處理
第八章 資料處理:連接、合併和重塑
第九章 繪圖與視覺化
第十章 資料聚合和分組
第十一章 時間序列
第十二章 pandas進階
第十三章 Python中的建模函式庫
第十四章 資料分析範例
附錄A 深入NumPy
附錄B 關於IPython系統