R語言具有上手快、效率高的特點,它橫跨金融、生物、醫學、網際網路等多個領域,主要用於統計、建模及可視化。預測是數據挖掘的主要應用之一,也是大數據時代的核心價值所在。基於R語言來做預測,兼具效率和價值的雙重屬性,是本書的一大特色。
本書共分三部份。第一部分講預測基礎,主要涵蓋預測概念理解、預測方法論、分析方法、特徵技術及評價,讀者透過這部份內容的學習,可以掌握進行預測的基本步驟和方法思路;第二部份講預測演算法,該部份包含多元迴歸分析、複雜迴歸分析及進階演算法,內容比較有難度,需要細心體會;第三部份講預測案例,包括短期日負荷曲線預測和股票價格預測兩個實例,讀者可以了解到實施預測時需要留意的技術細節。
本書特色
從入門開始逐漸深入,適合不同階段和程度的讀者
演算法理論與實際案例相結合。
將枯燥無味的預測演算法原理用R語言重現。
透過案例讓讀者掌握預測模型的應用。
作者簡介:
游皓麟
高階數據分析師,目前專注於NLP、知識圖譜以及深度學習的研究與實現。曾服務於華為技術軟體有限公司等企業,多次出席R語言會議並發表演講,在小象學院擔任過R語言數據挖掘和機器學習講師。
各界推薦
名人推薦:
颸拓科技董事長兼CTO,曾任京東DNN實驗室首席科學家 李成華
本書從入門開始逐漸深入,適合不同階段和程度的讀者,深入淺出,通俗易懂,是一本難得的好書。
樂視體育CTO 張旋
目前市場上以講解R語言工具、統計、資料挖掘、資料分析的居多,有系統地講解預測專題的很少,本書涵蓋方法、理論、實戰,非常適合從事預測、機器學習的朋友閱讀。
中科九峰智慧醫療CTO 李艦
一本數據實戰工作者真正需要的書,作者直指預測這一最具挑戰性的主題,用豐富的經驗和優美的語言如抽絲剝繭般說清楚了很多問題,非常不錯。
亞信科技大數據平台部人工智慧專家 劉愛松
本書思路清晰,案例真實且效果不錯,對從事分析、挖掘與機器學習的讀者具有很大的參考價值。
名人推薦:颸拓科技董事長兼CTO,曾任京東DNN實驗室首席科學家 李成華
本書從入門開始逐漸深入,適合不同階段和程度的讀者,深入淺出,通俗易懂,是一本難得的好書。
樂視體育CTO 張旋
目前市場上以講解R語言工具、統計、資料挖掘、資料分析的居多,有系統地講解預測專題的很少,本書涵蓋方法、理論、實戰,非常適合從事預測、機器學習的朋友閱讀。
中科九峰智慧醫療CTO 李艦
一本數據實戰工作者真正需要的書,作者直指預測這一最具挑戰性的主題,用豐富的經驗和優美的語言如抽絲剝繭般說清楚了很多問題,非常不錯。
亞信科技大數...
目錄
Part I 預測入門篇
本篇主要介紹預測的入門知識,如果讀者對預測有一定的功力,可以跳過本部分,直接進入第二部分,瞭解預測演算法的基本原理和實現。
第1章 預測入門
本章介紹預測的基本概念,以及大數據時代預測的特點,並結合案例進行講解,最後基於R語言講解一個預測案例。
第2章 預測方法論
本章介紹預測的方法論,其中預測流程是基礎,它說明了預測實施的各個階段。然後介紹了預測的指導原則,它是預測工作者必須要知道和必須要會的。
第3章 分析方法
本章內容是資料分析、資料採擷常見的分析方法,出現在這裡,主要是為預測技術的資料處理做鋪墊。如果預測工作者沒有掌握有效的分析思路和方法,去提煉有用的指標和特徵,那麼預測工作是很難進行下去的。
第4章 特徵構建技術
本章介紹特徵構建技術,不僅介紹了常見的特徵變換方法,還介紹了特徵組合的方法。
第5章 特徵選擇方法
本章介紹特徵選擇的方法,特徵選擇適合用於特徵很多(成千上萬個,甚至千百萬個)的情況。本章介紹了使用單變數和多變數特徵選擇技術,讀者可根據需要選擇性閱讀。
第6章 預測效果評估
本章介紹預測模型效果評估的方法,主要包括分類預測模型評估方法和數值預測模型評估方法。
Part II預測演算法篇
本篇主要介紹預測演算法,本部分的演算法選擇有一定的難度,基本包含了常見及部分高階的預測迴歸演算法,讀者可仔細閱讀。
第7章 線性迴歸及其優化
本章介紹線性迴歸技術,主要包括多元線性迴歸、Ridge迴歸、Lasso迴歸、分位數迴歸、穩健迴歸的內容。
第8章 複雜迴歸分析
本章介紹複雜迴歸技術,主要包括梯度提升迴歸樹(GBRT)、神經網路、支援向量機、高斯過程迴歸的內容。這是迴歸技術的進階部分,涉及統計學習以及機器學習的內容,想挑戰難度的朋友,一定要好好讀一讀這部分。
Part III預測應用篇
本篇主要介紹預測案例。
第9章 短期日負荷曲線預測
本章介紹短期日負荷曲線預測技術,首先介紹電力行業負荷預測的業務知識,接著從預測的基本要求出發,經過預測的建模準備,進入預測建模的環節。
第10章 股票價格預測
本章介紹股票價格預測技術,首先從股票市場的簡介開始,接著介紹股票資料的獲取,然後基於VAR演算法對預測模型進行了實現,最後檢驗了預測的準確性。
Part I 預測入門篇
本篇主要介紹預測的入門知識,如果讀者對預測有一定的功力,可以跳過本部分,直接進入第二部分,瞭解預測演算法的基本原理和實現。
第1章 預測入門
本章介紹預測的基本概念,以及大數據時代預測的特點,並結合案例進行講解,最後基於R語言講解一個預測案例。
第2章 預測方法論
本章介紹預測的方法論,其中預測流程是基礎,它說明了預測實施的各個階段。然後介紹了預測的指導原則,它是預測工作者必須要知道和必須要會的。
第3章 分析方法
本章內容是資料分析、資料採擷常見的分析方法,出現在這裡,主要是...