掌握大數據資料處理與分析的必備套件:PANDAS
全方位了解Pandas程式庫的特性,進行高效能資料處理及分析
Pandas是Python底下、用於實際資料分析上很受歡迎的一個套件。它提供有效率、快速、高效能的資料結構,使得資料探索及分析非常簡易。本書將引導讀者熟悉Pandas程式庫提供的各項完整功能,以進行資料的操控及分析。你將學到在Python底下如何用
Pandas進行資料分析。我們從資料分析的概觀開始,接著反覆地進行資料建模、從遠端來源存取資料、利用索引進行數值及統計分析、執行聚合分析,最後把統計資料視覺化,並且應用到金融領域。
從本書獲取這些知識後,不但可快速認識Pandas,也具備了將其應用到資料操作、資料分析、資料科學等領域的能力。
【適用讀者】
本書適合資料科學家、資料分析師、想用Pandas進行資料分析的Python程式設計師以及任何對資料分析感興趣的人閱讀。如果你具有一些統計及程式設計知識,則對於學習本書內容將會更有幫助,但是即使沒有統計及程式設計知識,或者沒有接觸過Pandas的經驗,也沒有關係。
【你能夠從本書學習到】
◎了解資料分析師及資料科學家對於蒐集、解讀資料的看法。
◎了解Pandas如何支援全程的資料分析程序。
◎善用Pandas序列及資料框物件來表示單變數及多變數資料。
◎利用Pandas切割資料,以及從多個來源進行資料的結合、分組、聚合等操作。
◎學習如何從外部來源,如檔案、資料庫以及網站服務存取資料。
◎表示及操控時間序列資料,以及了解與此類資料相關的許多複雜之處。
◎學習如何將統計資料視覺化。
◎學習如何利用Pandas解決金融領域常見的幾個資料表示及分析方面的問題。