內容簡介:適合程式設計新手,迅速進入資料科學領域。
資料匯入、整理、變換、視覺化與模型建立。
使用R和RStudio進行資料科學研究,利用tidyverse套件使工作更高效、流暢。
這一版介紹Tidyverse的最新功能和最佳實務做法,並新增章節介紹從不同來源獲取資料,進一步實踐所學。
「這本書更新了世界首屈一指的R資料科學實務指南,優秀程度令人驚歎,凡是與資料打交道的人都應該閱讀此書!」
—Emma Rand
University of York, UK
運用R將資料轉化為洞察力、知識和理解。透過這本實用的書籍,有志於成為資料科學家的讀者將學會如何使用R和RStudio進行資料科學研究,並利用tidyverse這組專為協同工作而設計的套件,讓資料科學實務變得更快速、流暢且有趣。即使沒有程式設計的經驗,本書最新版也能幫助你迅速進入資料科學的領域。
你將學會如何匯入、變換和視覺化資料,並傳達結果。你還將獲得資料科學流程的整體理解,以及管理細節所需的基本工具。這一版針對最新的tidyverse功能和最佳實務做法進行了更新,有新的章節示範如何從試算表、資料庫和網站獲取資料。其中的習題也將幫助你實踐所學。
你將學到如何:
‧視覺化:為資料探索和結果的交流創建圖表
‧變換:找出變數型別及處理它們的工具
‧匯入:將資料匯入R並轉換為方便分析的形式
‧程式設計:學習R語言的工具,以更清晰的方式輕鬆解決資料問題
‧溝通:使用Quarto整合說明、程式碼和分析結果
目錄
章節說明:導言
【第一篇 遊戲全貌】
第 01 章 資料視覺化
第 02 章 工作流程:基礎知識
第 03 章 資料變換
第 04 章 工作流程:程式碼風格
第 05 章 資料整理
第 06 章 工作流程:指令稿和專案
第 07 章 資料匯入
第 08 章 工作流程:尋求協助
【第二篇 視覺化】
第 09 章 圖層
第 10 章 探索式資料分析
第 11 章 溝通
【第三篇 變換】
第 12 章 邏輯向量
第 13 章 數字
第 14 章 字串
第 15 章 正規表達式
第 16 章 因子
第 17 章 日期與時間
第 18 章 缺失值
第 18 章 缺失值
第 19 章 Join
【第四篇 匯入】
第 20 章 試算表
第 21 章 資料庫
第 22 章 Arrow
第 23 章 階層式資料
第 24 章 Web Scraping
【第五篇 程式】
第 25 章 函式
第 26 章 迭代
第 27 章 基礎 R 的操作指南
【第六篇 溝通】
第 28 章 Quarto
第 29 章 Quarto 格式
索引
關於作者+出版記事
章節說明:導言
【第一篇 遊戲全貌】
第 01 章 資料視覺化
第 02 章 工作流程:基礎知識
第 03 章 資料變換
第 04 章 工作流程:程式碼風格
第 05 章 資料整理
第 06 章 工作流程:指令稿和專案
第 07 章 資料匯入
第 08 章 工作流程:尋求協助
【第二篇 視覺化】
第 09 章 圖層
第 10 章 探索式資料分析
第 11 章 溝通
【第三篇 變換】
第 12 章 邏輯向量
第 13 章 數字
第 14 章 字串
第 15 章 正規表達式
第 16 章 因子
第 17 章 日期...