購物比價找書網找車網
FindBook
排序:
 
 有 1 項符合

張兆靜

的圖書
圖書介紹 - 資料來源:TAAZE 讀冊生活   評分:
圖書名稱:大數據X資料探勘X智慧營運

【想深入了解大數據、資料探勘的讀者請進!!】

什麼是資料前處理?
電信業者跟資料探勘有什麼關係?
神經網路具體到底是什麼?
集群分析的演算法有哪些?

◎資料探勘的「十大經典演算法」你都認識嗎?
國際權威的學術組織the IEEE International Conference on Data Mining (ICDM)評出了資料探勘領域的十大經典演算法:C4.5、K-Means、SVM、Apriori、EM、PageRank、AdaBoost、KNN、Naive Bayes和CART。

1.C4.5演算法
C4.5是一種用在機器學習和資料探勘領域的分類問題中的演算法。它基於以下假設:給定一個資料集,其中的每一個元組都能用一組屬性值來描述,每一個元組屬於一個互斥的類別中的某一類。C4.5的目標是透過學習,找到一個從屬性值到類別的映射關係,並且這個映射能用於對新的類別未知的實體進行分類。

2.The K-Means Algorithm (K-Means演算法)
K-MeansAlgorithm是一種聚類演算法,它把n個對象根據他們的屬性分為k個分割,k
◎結構化/半結構化/非結構化資料有什麼不同?
(一)結構化資料:能夠用數據或統一的結構加以表示的資料,如數字、符號。傳統的關係資料模型,儲存於資料庫,通常可用二維表結構表示。
(二)非結構化資料:是指其欄位長度可變,並且每個欄位的記錄又可以由可重複或不可重複的子欄位構成的資料庫,用它不僅可以處理結構化資料(如數字、符號等資訊)而且更適合處理非結構化資料(全文文字、圖像、聲音、影視、超媒體等資訊)。
(三)半結構化資料: XML、HTML文檔就屬於半結構化資料。它一般是自描述的,資料結構和內容混在一起,沒有明顯的區分。

◎如何設計神經網路的拓撲結構?
在開始訓練之前,用戶必須確定網路拓撲,說明輸入層的單元數、隱藏層數(如果多於一層)、每個隱藏層的單元數和輸出層的單元數。

對訓練元組中每個屬性的輸入測量值進行規範化將有助於加快學習過程。通常,對輸入值規範化,使得它們落入0.0和1.0之間。離散值屬性可以重新編碼,使得每個域值有一個輸入單元。例如,如果屬性A有3個可能的或已知的值{a0,a1,a2}則可以分配三個輸入單元表示A,即我們可以用I0,I1,I2作為輸入單元。每個單元都初始化為0。如果A=a0,則I0置為1,其餘為0;如果A=a1,則I1置1,其餘為0;諸如此類。

神經網路可以用於分類(預測給定元組的類標號)和數值預測(預測連續值輸出)。對於分類,一個輸出單元可以用來表示兩個類(其中值1代表一個類,而值0代表另一個類)。如果多於兩個類,則每個類使用一個輸出單元。

★全書特色
全書分為九章,內容包括:大資料探勘與智慧營運的概念,資料前處理,資料探勘中的四種主流演算法:集群分析、分類分析、迴歸分析、關聯分析,增強型資料探勘演算法,資料探勘在營運商智慧營運中的應用案例,未來大資料探勘的發展趨勢等。主要提供給電信業者及其他高科技企業員工、大專院校學生和研究生,以及其他對資料探勘與精準行銷感興趣的讀者。

作者簡介:

梁棟,電機博士,碩士研究生導師,曾主持和參加多項自然科學基金項目,主要研究方向為大數據、資料探勘與智慧營運,所帶領的研究團隊在包括IEEE Internet of things Journal、IEEE International Conference on Data Mining等知名學術期刊和會議上發表學術論文二十多篇,並且長期與電信業進行科技產業化合作。

張兆靜,任職於知名電信業,大數據分析專家,曾在IEEE等著名會議上發表論文十篇,主持多項大數據與智慧營運案,曾獲公司頒發的最佳培訓實踐獎。

彭木根,電機博士,畢業後留校任教,博士生導師,擔任IET、IJCS、IJDSN、IJAP等國際SCI學術期刊論文的專刊編委、助理編委或特邀主編。曾擔任Wicon 2010、PlanNet等國際學術會議技術專題合作主席。長期擔任ICC、Globecom、WCNC、PIMRC等多個國際學術會議的技術委員。一直從事TDD無線網路資訊理論、協同網路編碼、無線網路自組織技術、TDD高效能無線傳輸與組網技術、TD-SCDMA及增強演進系統的傳輸,與增強組網技術的研發工作。

章節試閱

1.7 現有資料探勘的主要分析軟體與系統

1.7.1 Hadoop

提到大數據和資料探勘,很多人馬上想到的就是Hadoop。說到Hadoop就不能不說Google的三篇論文。Google在2003年到2006年間發表了三篇非常有名的論文,它們分別是2003年SOSP的GFS(Google File System),2004年OSDI的MapReduce以及2006年OSDI的BigTable。這三篇論文奠定了現在主流大數據分析處理系統的理論基礎。基於這些,現今演化出各式各樣的大數據處理和分析系統。

Hadoop最開始起源於Apache Nutch,後者是一個開源的網路搜尋引擎,本身也是由Lucene項目的一部分。Nutch項...
顯示全部內容
作者序

前言

資料探勘(Data Mining),是指從資料中發現知識的過程(Knowledge Discovery in Databases, KDD)。狹義的資料探勘一般指從大量的、不完全的、有雜訊的、模糊的、隨機的實際應用數據中,提取隱含其中的、人們事先不知道的、但又是潛在有用知識的過程。自從電腦發明之後,科學家們先後提出了許多優秀的資料探勘演算法。2006年12月,在資料探勘領域的權威學術會議the IEEE International Conference on Data Mining(ICDM)上,科學家們評選出了該領域的十大經典演算法:C4.5、K-Means、SVM、Apriori、EM、PageRank、AdaBoost、...
顯示全部內容
目錄
內容簡介
前言
第1章 大數據、資料探勘與智慧營運綜述
1.1 資料探勘的發展史
1.1.1 資料探勘的定義與起源
1.1.2 資料探勘的早期發展
1.1.3 資料探勘的演算法前傳
1.1.4 資料探勘的第一個里程碑
1.1.5 最近十年的發展與應用
1.2 資料探勘的主要流程與金字塔模型
1.2.1 資料探勘的任務
1.2.2 資料探勘的基本步驟
1.2.3 資料探勘的架構——雲端運算
1.2.4 「金字塔」模型
1.3 資料探勘對智慧營運的意義
1.3.1 「互聯網+」時代的來臨及其對營運商的衝擊和挑戰
1.3.2 大數據時代的來臨及其對營運商的挑戰和機遇
1.3.3 電信業者...
顯示全部內容
贊助商廣告
 
城邦讀書花園 - 今日66折
報價天王林信富分析師的超省力散戶投資術
出版社:Smart智富
出版日期:2023-12-12
66折: $ 251 
博客來 - 今日66折
瘦一輩子的本事:心理學權威的10堂知心瘦身課,跳出飲食陷阱,跟減不完的肥說ByeBye
作者:茱蒂絲.貝克 (Judith S. Beck, Deborah Beck Busis)
出版社:方舟文化
出版日期:2024-02-06
66折: $ 277 
TAAZE 讀冊生活 - 今日66折
他們互相傷害的時候︰台灣文學百年論戰
作者:朱宥勳
出版社:大塊文化出版股份有限公司
出版日期:2023-08-29
66折: $ 356 
 
Taaze 讀冊生活 - 暢銷排行榜
沒有門檻的幸福
作者:楊士毅
出版社:大塊文化出版股份有限公司
出版日期:2024-02-23
$ 458 
金石堂 - 暢銷排行榜
霓虹街的蜘蛛與蝶 特典版三冊合購
作者:滝端
出版社:青文出版社股份有限公司
出版日期:2024-05-29
$ 427 
博客來 - 暢銷排行榜
噬亡村完全版(10)
作者:二宮正明
出版社:尖端
出版日期:2024-05-16
$ 212 
博客來 - 暢銷排行榜
情緒大飯店
作者:莉迪亞.布蘭科維琪 (Lidia Branković)
出版社:小典藏出版
出版日期:2024-04-03
$ 276 
 
金石堂 - 新書排行榜
遭背叛的S級冒險者決定跟心愛的奴隸們組成奴隸後宮公會(04)
作者:川田暁生
出版社:青文出版社股份有限公司
出版日期:2024-05-15
$ 111 
Taaze 讀冊生活 - 新書排行榜
噢,我的天哪!【法國兒童文學現代經典,國際安徒生獎作家作品】
作者:瑪麗奧德.穆海
出版社:時報文化出版企業股份有限公司
出版日期:2024-05-28
$ 266 
金石堂 - 新書排行榜
羅生門:芥川龍之介短篇小說選I(台語翻譯版.限量贈有聲書)
作者:芥川龍之介
出版社:木馬文化事業有限公司
出版日期:2024-06-07
$ 316 
金石堂 - 新書排行榜
被夾在百合之間的我,順勢劈腿了(01)
$ 190 
 

©2024 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策