內容簡介:🏆🏆🏆 Amazone 400+ 五星好評 🏆🏆🏆
👉 資料領域的必讀書單📚 ,適合IT專業人士和學生,尤其適合希望深入了解資料工程的讀者。
👉 書中提供資料工程的基本和進階概念,對於理解當前和未來的資料工程趨勢和技術非常有幫助。
👉 作者的寫作風格值得讚賞,使用的比喻和舉例能將複雜的概念有效簡化,更易理解。
👉 提供清晰的資料工程生命週期概念,有助提升資料管理和專案管理的能力。
「資料世界發展到現在已經有一段時間。首先從設計師開始,然後是資料庫管理員,接著是首席資訊官,然後是資料架構師。這本書將促使該行業朝著更加成熟和先進的方向發展。對於每一位認真對待自己的專業和職業的人來說,這都是一本必讀之作。」
—Bill Inmon
資料倉儲創建者
「《資料工程基礎》是一本絕佳的入門書籍,涵蓋了資料遷移、處理和管理的相關業務。我要強力推薦給任何想要快速瞭解資料工程或分析方面的人,或者想要填補自己知識漏洞的現有從業人員。」
—Jordan Tigani
MotherDuck創始人和首席執行官 / BigQuery創始工程師和共同創始人
過去十年來,資料工程發展迅速,讓許多軟體工程師、資料科學家及分析師渴望全面了解這個領域的全貌。這本實用的書籍將告訴你,如何在資料工程生命週期的框架下,評估並選擇最適合的技術,規劃和建構系統能滿足你的組織與客戶需求的資料系統。
本書作者Joe Reis和Matt Housley將帶您深入瞭解資料工程生命週期,並解說如何把各種雲端技術接合起來,以滿足下游資料消費者的需求。你將瞭解如何應用資料產生、攝取、編排、轉換、儲存和治理等概念,這些概念在任何資料環境中都至關重要,而且與底層技術無關。
本書將助您:
‧掌握資料工程領域的精要與全貌。
‧使用端到端的最佳實踐框架評估資料工程問題。
‧正確選擇資料技術、架構和流程,避開誇大的行銷手法。
‧使用資料工程生命週期來設計和建構強大、穩健的架構。
‧將資料治理與安全性融入整個資料工程的生命週期。
目錄
章節說明:第一篇 基本概念和構成要素
第一章 資料工程概述
第二章 資料工程生命週期
第三章 設計良好的資料架構
第四章 在資料工程生命週期中的各個階段,選擇適合的技術
第二篇 資料工程生命週期深入解析
第五章 來源系統中資料的產生
第六章 儲存
第七章 攝取
第八章 查詢、建模和轉換
第九章 為分析、機器學習和反向 ETL 提供資料
第三篇 安全性、隱私以及資料工程的未來
第十章 安全性和隱私
第十一章 資料工程的未來
附錄A 序列化和壓縮技術細節
附錄B 雲端網路
章節說明:第一篇 基本概念和構成要素
第一章 資料工程概述
第二章 資料工程生命週期
第三章 設計良好的資料架構
第四章 在資料工程生命週期中的各個階段,選擇適合的技術
第二篇 資料工程生命週期深入解析
第五章 來源系統中資料的產生
第六章 儲存
第七章 攝取
第八章 查詢、建模和轉換
第九章 為分析、機器學習和反向 ETL 提供資料
第三篇 安全性、隱私以及資料工程的未來
第十章 安全性和隱私
第十一章 資料工程的未來
附錄A 序列化和壓縮技術細節
附錄B 雲端網路