運用各種資料分析套件和統計模型, 解決大數據時代所會遇到的各種難題
R 語言是公認處理大數據的最佳利器, 不只免費、語法簡單、直覺, 還具備數千個功能強大的延伸套件, 更讓 R 語言深入各種不同的應用領域。本書由國際知名的資料分析專家執筆, 作者具備豐富的 R 語言教學經驗, 從中篩選出 R 的基本功能和最新、最好用的套件, 並以各種資料集案例, 具體展現資料分析成果。
對於有心跨足資料科學、數據分析、量化交易、人工智慧、機器學習等領域的讀者, 只會 R 語言的語法自然是不夠的。我們將帶您運用各種資料分析套件和統計模型, 解決大數據時代所會遇到的各種難題, 包括:向量運算、文字探勘、資料視覺化、趨勢預測、資料建模, 以及各種分析結果的輸出、引用與動態呈現等, 全面掌握 R 語言的各種技巧。
本書特色
●向量運算:全向量化的資料結構, 包括:vector、factor vector、data.frame、list、matrix、array 等
●文字探勘:各類資料匯入讀取、抽取字串、表格轉換與合併、資料聚合、資料正規化、網路爬蟲
●資料視覺化:最吸睛的 ggplot2 套件圖表繪製技巧, 並利用 Shiny 套件產生網頁互動展示儀表板
●機率統計:快速領略統計學核心應用, 抽樣分佈、假設檢定、變異數分析、資料分群
●趨勢預測:展現大數據威力的強力工具, 線性迴歸、廣義線性模型、非線性模型、時間序列與自相關性
●資料建模:機器學習的基礎, 利用 Caret 評斷資料模型配適度, 建立資料測試與訓練機制, 透過交叉驗證和參數挑選建立最佳模式
●進階應用:資料分析師必學的套件包裝與發佈、報表/投影片製作、制式化文件輸出等