實戰大數據——MATLAB數據挖掘詳解與實踐

作者:許國根,賈瑛

出版:清華大學出版社

年代:2017 更多圖書信息

圖書簡介

大數據時代,我們需要對各種海量數據進行篩選、清洗、挖掘,在這個過程中,獲取有效數據的方式方法和模型算法成為了整個數據挖掘過程的重點,MATLAB作為一個數據挖掘工具,如何正確和準確地使用它成為了重中之重。針對實際應用數據挖掘技術的要求,本書既介紹了數據挖掘的基礎理論和技術,又較為詳細地介紹了各種算法以及MATLAB程序。本書共分4篇,分別介紹了數據挖掘的基本概念、技術與算法以及應用實例。期望通過大量的實例分析幫助廣大讀者掌握數據挖掘技術,并應用于實際的研究中,提高對海量數據信息的處理及挖掘能力。本書針對性和實用性強,具有較高的理論和實用價值。本書作者就職于部隊高校,專攻數據挖掘,并應用于大量實際項目,本書同時得到了國內著名數據挖掘公司的技術支持,很多案例來自實際項目。本書可作為高等院校計算機工程、信息工程、生物醫學工程、化學、環境、經濟、管理等學科的研究生、本科生的教材或教學參考書,亦可作為企事業單位管理者、信息分析人員、市場營銷人員和研究與開發人員的參考資料。

(展開)

編輯推薦

這是一本真正具備中國特色的數據挖掘手冊,各種常規方法一應俱全,作者是高校教授,同時也是若干公司的數據挖掘顧問,難得的理論儲備與實踐經驗都十分深厚,表達能力也很強,也了解痛點。基于這些背景創作的這本書,非常好。

(展開)

目錄

第1章 緒論 1
1.1 數據挖掘概述 2
1.2 數據挖掘的分類 4
1.3 數據挖掘的過程 5
1.4 數據挖掘的任務 6
1.5 數據挖掘的對象 8
1.5.1 數據庫 8
1.5.2 文本 10
1.5.3 圖像與視頻數據 10
1.5.4 Web數據 11
1.6 數據挖掘建模方法 11
1.6.1 業務理解 12
1.6.2 數據理解 13
1.6.3 數據準備 13
1.6.4 建模 14
1.6.5 評估 15
1.6.6 部署 16
1.7 數據挖掘的應用 16
1.7.1 在金融領域的應用 16
1.7.2 在零售業中的應用 17
1.7.3 在電信業的應用 18
1.7.4 在管理中的應用 19
1.7.5 在化學研究領域中的應用 19
1.7.6 在材料研究、生產方面的應用 20
1.7.7 在機械故障診斷與監測中的應用 21
1.7.8 在醫療領域中的應用 22
第2章 數據挖掘算法 25
2.1 決策樹算法 26
2.1.1 決策樹基本算法 27
2.1.2 ID3算法 29
2.1.3 C4.5算法 30
2.1.4 CART算法 31
2.1.5 決策樹的評價標準 32
2.1.6 決策樹的剪枝及優化 33
2.1.7 基于matlab的決策樹分析 34
2.2 人工神經網絡算法 41
2.2.1 人工神經網絡概述 41
2.2.2 人工神經網絡的基本模型 41
2.2.3 BP神經網絡 43
2.2.4 RBF神經網絡 45
2.2.5 SOM神經網絡 46
2.2.6 反饋型神經網絡(Hopfield) 47
2.2.7 基于matlab的神經網絡方法 49
2.3 進化算法 55
2.3.1 進化算法的基本原理 56
2.3.2 基因算法的主要步驟 60
2.3.3 基本遺傳算法 61
2.3.4 進化規劃算法 63
2.3.5 進化策略計算 64
2.3.6 量子遺傳算法 68
2.3.7 人工免疫算法 72
2.3.8 基于matlab的進化算法 80
2.4 統計分析方法 87
2.4.1 假設檢驗 87
2.4.2 回歸分析 91
2.4.3 二項邏輯(logistic)回歸 100
2.4.4 方差分析 104
2.4.5 主成分分析 107
2.4.6 因子分析 110
2.4.7 基于matlab的統計分析方法 113
2.5 貝葉斯網絡方法 141
2.5.1 貝葉斯定理、先驗和后驗 142
2.5.2 貝葉斯網絡 142
2.5.3 貝葉斯網絡學習 143
2.5.4 主要貝葉斯網絡模型 145
2.5.5 基于matlab的貝葉斯網絡方法 148
2.6 支持向量機 160
2.6.1 支持向量機概述 160
2.6.2 核函數 162
2.6.3 基于matlab的支持向量機方法 164
2.7 關聯分析 167
2.7.1 概述 167
2.7.2 Apriori關聯規則算法 170
2.7.3 基于分類搜索的關聯規則算法 171
2.7.4 時序關聯規則算法 173
2.7.5 多值屬性關聯規則算法 174
2.7.6 增量關聯規則算法 175
2.7.7 基于關聯規則的分類算法 176
2.7.8 模糊關聯分類算法 177
2.7.9 關聯規則的評價 178
2.7.10 辛普森悖論 179
2.7.11 基于matlab的關聯規則分析 180
2.8 其他數據挖掘方法 182
2.8.1 近鄰法 182
2.8.2 K-means聚類 184
2.8.3 基于matlab的近鄰法及k-means聚類法 187
第3章 數據挖掘相關技術 191
3.1 數據倉庫 192
3.1.1 概述 192
3.1.2 數據倉庫設計 195
3.1.3 數據倉庫的開發應用 199
3.1.4 數據倉庫的技術管理 209
3.1.5 OLAP技術 210
3.1.6 基于matlab的數據倉庫開發技術 214
3.2 模糊集理論 234
3.1.1 模糊集合 234
3.1.2 模糊關系 237
3.1.3 模糊聚類 239
3.3.5 基于matlab的模糊集處理技術 244
3.3 粗糙集技術 255
3.3.1 粗糙集理論的基本概念 256
3.3.2 分類規則的形成 259
3.3.3 知識的約簡 259
3.3.4 模糊集與粗糙集 261
3.3.5 基于matlab的粗糙集處理方法 262
3.4 目標優化技術 265
3.4.1 極值問題 266
3.4.2 無約束非線性規劃 267
3.4.3 有約束非線性規劃 270
3.4.4 大規模優化問題的分解算法 270
3.4.5 其他優化方法 273
3.4.6 基于matlab的目標優化方法 274
3.5 可視化技術 281
3.5.1 可視化技術分類 282
3.5.2 多維數據可視化 283
3.5.3 圖形的特征分析 294
3.5.4 基于多元圖的圖形分類方法 297
3.5.5 基于色度學空間的多元圖表示 299
3.5.6 基于matlab的數據可視化技術 300
3.6 公式發現 314
3.6.1 概述 315
3.6.2 公式發現系統中的知識 315
3.6.3 基于matlab的公式發現 319
3.7 多媒體數據挖掘技術 320
3.7.1 文本挖掘 323
3.7.2 圖像挖掘 331
3.7.3 視頻挖掘 331
3.7.4 音頻挖掘 332
3.7.5 復合類型數據的挖掘 333
3.8 Web數據挖掘技術 334
3.8.1 Web內容挖掘 335
3.8.2 Web結構挖掘 337
3.8.3 Web使用挖掘 338

第4章 數據挖掘應用實戰 343
4.1 數據關系發現 344
4.2 數據統計特性 344
4.3 數據預處理 349
4.3.1 數據清理 349
4.3.2 數據集成與轉換 351
4.3.3 數據歸約與濃縮 353
4.3.4 數值數據的概念分層與離散化 360
4.3.5 例題 362
4.4 分類 373
4.5 例題 376
4.6 預測 381
4.6.1 回歸分析 381
4.6.2 時間序列預測模型 385
4.6.3 馬爾可夫鏈 389
4.6.4 灰色系統方法 390
4.6.5 例題 398
4.7 聚類 418
4.7.1 聚類分析概述 418
4.7.2 聚類分析中的數據類型 419
4.7.3相似性度量 422
4.7.4 聚類的特征 427
4.7.5 聚類準則 427
4.7.6 劃分方法 429
4.7.7 層次方法 430
4.7.8 基于密度的方法 433
4.7.9 基于網格的方法 434
4.7.10 基于模型的聚類方法 435
4.4.11 基于目標函數的方法 436
4.7.12 離群點檢測 438
4.7.13 聚類有效性 445
4.7.14 例題 448
4.8 時序數據挖掘 462
4.8.1 基本定義 463
4.8.2 時序數據挖掘參數 464
4.8.3 時序關聯規則 464
4.8.4 時間序列挖掘 466
4.8.5 時間序列分段線性表示 468
4.8.6 時間序列的預測 469
4.8.7 例題 469
4.9 關聯規則挖掘 481
4.9.1 關聯規則的類型及挖掘算法 481
4.9.2 基于組織進化的關聯規則挖掘 481
4.9.3 基于組織層次進化的關聯規則挖掘 483
4.9.4 多維關聯規則挖掘 484
4.9.5 關聯規則擴展 485
4.9.6 例題 487
參考文獻 500
(展開)

書頁展示

更多圖書信息
數據來源于網絡,如有問題,請反饋至此郵箱:[email protected]

作者:許國根,賈瑛
出版:清華大學出版社

ISBN:9787302451013

出版日期:2017-08-01

資源下載

隨書資源(共 2 個)
需購買電子紙書才可查看!

清華大學出版社

清華大學出版社

清華大學出版社成立于1980年6月,是由教育部主管、清華大學主辦的綜合出版單位。植根于“清華”這座久負盛名的高等學府,秉承清華人“自強不息,厚德載物”的人文精神,清華大學出版社在短短二十多年的時間里,迅速成長起來。作為來自一流大學的出版單位,清華大學出版社始終堅持弘揚科技文化產業、服務科教興國戰略的出版方向,把出版高等學校教學用書和科技圖書作為主要任務,并為促進學術交流、繁榮出版事業設立了多項出版基金,逐漸形成了以出版高水平的教材和學術專著為主的鮮明特色,在教育出版領域樹立了強勢品牌。目前,清華版教材已在全國一百多所院校得到廣泛使用。高品質、多層次的計算機圖書是清華大學出版社的一大品牌支柱。20世紀80年代末,在席卷全球的信息化浪潮中,清華大學出版社快速切入計算機圖書市場,逐漸成為并一直保持這一市場的領先地位,為發展中國計算機教育做出了巨大貢獻。

(展開)

使用移動設備
掃描二維碼下載客戶端

注:目前僅提供安卓客戶端下載

相關書卡
書卡里除了這本書,還有更多經典等你讀!

Copyright ?2019  BookAsk 書問  |  京ICP證160134號   |  

京公網安備 11010802026432號

  |  出版物經營許可證新出發京零字第海150168號   |  營業執照:91110108318038279C   |  網站地圖   |  關于我們   |  合作伙伴   |  商務合作   |  友情鏈接
深蓝海域投注