購物比價找書網找車網
FindBook  
 有 1 項符合

R高性能編程

的圖書
R高性能程式設計 R高性能程式設計

作者:Aloysius 
出版社:N/A
出版日期:2015-12-01
語言:簡體書   
圖書選購
型式價格供應商所屬目錄
二手書
$ 45
TAAZE 讀冊生活 TAAZE 讀冊生活
二手中文書
圖書介紹 - 資料來源:博客來   評分:
圖書名稱:R高性能編程

內容簡介

本書對R語言做了簡要描述,配以大量編程實踐和代碼樣例,適合於想要提高R語言性能的程序員和開發者,對大量數據的處理、R語言的實際應用、基准測試均有指導意義。

現代社會面對越來越龐大的數據和數據分析,R語言正是分析和處理大數據的有效方式,本書正是全面解析R語言的優秀書目。

Aloysius Lim
擅長將復雜的數據和模型表述為簡單易懂的見解。作為About People的聯合創辦者、數據科學家及設計顧問,他喜歡解決問題,以及幫助他人尋找利用數據解決業務難題的實踐方案。在政府、教育和零售行業長達7年的豐富經驗,造就了他尋找具有創造性的解決辦法的獨特視角。
衷心地感謝上帝給我機會撰寫本書,讓我分享這些知識。在這個過程中,我親愛的妻子Bethany給予了極大的支持和鼓勵。謝謝你全部的愛,親愛的。非常感謝我的搭檔William,他是我靈感和洞察力的來源。

William Tjhi
數據科學家,在學術、政府及工業界具有多年的工作經驗。他自讀博期間開始了數據科學之旅,研究了一些新算法以提高高維數據聚類的健壯性。取得博士學位之后,他從基礎研究轉向了應用研究,致力於采用機器學習方法解決分子生物學和傳染病學中的各種問題。他在一些同行評審的期刊和會議上發表了部分研究成果。隨着大數據的興起,William離開了學術界,轉而投入工業界,開始了商業和公共部門領域的數據科學實踐。William熱衷於R,從他搞研究的那天開始就一直使用R作為主要的分析工具。他曾經是Revolution Analytics的一員,那時候他做了很多使R更加適合大數據的貢獻。
 

目錄

1 理解R的性能:為什麼R程序有時候很慢?1
計算性能的三個限制因素:CPU、RAM和磁盤I/O2
R是運行時解釋的4
R是單線程的5
R需要將全部數據加載到內存5
算法設計影響時間和空間復雜度6
小結9

2 性能分析:衡量代碼的性能11
衡量總運行時間11
使用system.time衡量運行時間12
使用rbenchmark重復衡量運行時間13
使用microbenchmark衡量運行時間的分布15
分析運行時間16
使用Rprof分析函數的性能16
性能分析的結果18
分析內存使用情況20
使用OS工具監控內存使用情況、CPU使用情況和磁盤I/O22
瓶頸的發現及解決23
小結26

3 加快R運行的簡單方法27
向量化27
使用內置函數29
預分配內存30
使用更簡單的數據結構33
使用哈希表進行大型數據上的頻繁查找34
去CRAN尋找更快的包35
小結36

4 使用編譯代碼加快運行速度37
在運行之前編譯R代碼37
編譯函數38
即時編譯(JIT)R代碼41
在R中使用編譯語言41
前提條件42
以內聯形式包含編譯代碼42
調用外部編譯代碼46
使用編譯代碼的注意事項49
小結52

5 使用GPU讓R運行得更快53
GPU上的通用計算53
R和GPU54
安裝gputools55
使用gputools實現快速統計建模55
小結59

6 減少內存使用的簡單方法61
重用對象而不多占用內存61
刪除不再需要的中間數據66
運行時計算值而不是永久性存儲值69
交換活躍數據和非活躍數據71
小結71

7 使用有限的內存處理大型數據集73
使用節約內存的數據結構73
更小的數據類型76
稀疏矩陣77
對稱矩陣78
比特向量79
使用內存映射文件並以塊的形式處理數據80
bigmemory包81
ff包85
小結89

8 使用並行計算加倍提升性能91
數據並行性 v.s.任務並行性91
實現數據並行的算法95
實現任務並行的算法98
集群節點運行同一個任務時98
集群節點運行多個不同任務時100
計算機集群並行執行多個任務102
共享內存並行性 v.s.分布式內存並行性104
優化並行的性能108
小結109

9 將數據處理交給數據庫系統111
將數據抽取到R v.s.在數據庫中處理數據111
在關系型數據庫中使用SQL進行數據預處理112
將R表達式轉化為SQL116
使用dplyr117
使用PivotalR119
在數據庫中運行統計和機器學習算法122
使用列式數據庫提升性能125
使用數據庫陣列最大化科學計算的性能128
小結129

10 R和大數據131
理解Hadoop131
在Amazon Web Services上配置Hadoop133
使用Hadoop批量處理大型數據集136
將數據上傳到HDFS136
使用RHadoop分析HDFS數據138
R中的其他Hadoop包142
小結143
 

隨着數據越來越重要,商家和科學家們也越來越需要高效分析和處理大規模數據的工具。近年來,R這一工具越來越普遍地應用於數據處理、統計分析和數據科學。雖然R最初源自學術界,但如今已經被工業界各個組織廣泛使用。
然而,由於R本身的設計問題,它能夠有效處理的數據規模和計算復雜度有限。這對於需要處理日益增長的大規模數據的R用戶來說,是個極大的障礙。
 

詳細資料

  • ISBN:9787121273964
  • 規格:144頁 / 普通級 / 1-1
  • 出版地:大陸
贊助商廣告
 
金石堂 - 今日66折
葛瑞的囧日記9-12集套書
66折: $ 1003 
金石堂 - 今日66折
啟動內在感官的十二堂課有聲書:豐盛.靜心(新版)
作者:陳嘉珍
出版社:賽斯文化
出版日期:2017-05-01
66折: $ 211 
金石堂 - 今日66折
大人機時代的因應對策:比維他命C還重要的LIFE-C
作者:李啟龍
出版社:聚光文創
出版日期:2019-06-25
66折: $ 317 
金石堂 - 今日66折
我要準時下班!(日劇《我要準時下班》原著小說)
作者:朱野歸子
出版社:采實文化事業股份有限公司
出版日期:2019-09-26
66折: $ 231 
 
Taaze 讀冊生活 - 暢銷排行榜
你願意,人生就會值得:蔡康永的情商課3
作者:蔡康永
出版社:如何出版
出版日期:2024-08-01
$ 316 
金石堂 - 暢銷排行榜
請注視深夜裡的我  特典版
$ 153 
Taaze 讀冊生活 - 暢銷排行榜
全圖解‧完全不敗!從起針開始學鉤織(熱銷經典版)
作者:BOUTIQUE-SHA
出版社:Elegant-Boutique新手作
出版日期:2021-02-20
$ 210 
 
金石堂 - 新書排行榜
神聖旅程:揭開生命與死亡的奧祕
作者:斯瓦米.拉瑪
出版社:橡實
出版日期:2025-01-13
$ 300 
博客來 - 新書排行榜
小美老師如是說 6 (首刷限定版)
作者:鹿成徳策
出版社:東立
出版日期:2025-01-23
$ 195 
Taaze 讀冊生活 - 新書排行榜
愛上我,感受我(全)
作者:龍牙翔
出版社:紳士出版
出版日期:2025-01-23
$ 220 
金石堂 - 新書排行榜
夢想♡成真 無修正
作者:武田弘光
出版社:未來數位有限公司
出版日期:2025-01-22
$ 261 
 

©2025 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策