最新公告
  • 开通终身SVIP,享全站不限量下载次数-云资源-集成各类网络资源-正在更新中-预计更新到5W+文章开通SVIP
  • 文章介绍
  • 评价建议
  • 资源名称:数据挖掘-概念模型方法和算法 第2版

    内容简介:

    随着数据集规模和复杂度的持续上升,分析员必须利用更高级的软件工具来执行间接的、自动的智能化数据分析。《数据挖掘:概念、模型、方法和算法(第2版)》介绍了通过分析高维数据空间中的海量原始数据来提取用于决策的新信息的尖端技术和方法。

    本书开篇阐述数据挖掘原理,此后在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模糊逻辑和演化计算等学科的具有代表性的、最前沿的挖掘方法和算法。本书还着重描述如何恰当地选择方法和数据分析软件并合理地调整参数。每章末尾附有复习题。

    本书主要用作计算机科学、计算机工程和计算机信息系统专业的研究生数据挖掘教材,高年级本科生或具备同等教育背景的读者也完全可以理解本书的所有主题。

    ◆ 介绍支持向量机(SVM)和Kohonen映射

    ◆ 讲解DBSCAN、BIRCH和分布式DBSCAN聚类算法

    ◆ 介绍贝叶斯网络,讨论图形中的Betweeness和Centrality参数测量算法

    ◆ 分析在建立决策树时使用的CART算法和基尼指数

    ◆ 介绍Bagging & Boosting集成学习方法,并详述AdaBoost算法

    ◆ 讨论Relief以及PageRank算法

    ◆ 讨论文本挖掘的潜在语义分析(LSA),并分析如何测定文本文档之间的语义相似性

    ◆ 讲解时态、空间、Web、文本、并行和分布式数据挖掘等新主题

    ◆ 更详细地讲解数据挖掘技术商业、隐私、安全和法律方面的内容

    作者简介:

    Mehmed Kantardzic博士是美国路易维尔大学工学院计算机工程与科学系的教授,任该系的研究生院院长和数据挖掘实验室主任。Mehmed是IEEE、ISCA和SPIE的成员,曾受邀参加多个重要的学术会议;他已出版多本书籍,在许多期刊上发表过论文,其中有多篇论文获奖。

    资源目录:

    第1章 数据挖掘的概念 1

    1.1 概述 1

    1.2 数据挖掘的起源 3

    1.3 数据挖掘过程 4

    1.4 大型数据集 7

    1.5 数据仓库 10

    1.6 数据挖掘的商业方面:为什么

    数据挖掘项目会失败 13

    1.7 本书结构安排 15

    1.8 复习题 16

    1.9 参考书目 17

    第2章 数据准备 19

    2.1 原始数据的表述 19

    2.2 原始数据的特性 23

    2.3 原始数据的转换 24

    2.3.1 标准化 24

    2.3.2 数据平整 25

    2.3.3 差值和比率 25

    2.4 丢失数据 26

    2.5 时间相关数据 27

    2.6 异常点分析 30

    2.7 复习题 35

    2.8 参考书目 38

    第3章 数据归约 41

    3.1 大型数据集的维度 41

    3.2 特征归约 43

    3.2.1 特征选择 44

    3.2.2 特征提取 48

    3.3 Relief算法 50

    3.4 特征排列的熵度量 51

    3.5 主成分分析 53

    3.6 值归约 55

    3.7 特征离散化:

    ChiMerge技术 58

    3.8 案例归约 61

    3.9 复习题 63

    3.10 参考书目 64

    第4章 从数据中学习 67

    4.1 学习机器 68

    4.2 统计学习原理 72

    4.3 学习方法的类型 75

    4.4 常见的学习任务 77

    4.5 支持向量机 80

    4.6 kNN:最近邻分类器 90

    4.7 模型选择与泛化 92

    4.8 模型的评估 95

    4.9 90%准确的情形 100

    4.9.1 保险欺诈检测 101

    4.9.2 改进心脏护理 102

    4.10 复习题 103

    4.11 参考书目 104

    第5章 统计方法 107

    5.1 统计推断 107

    5.2 评测数据集的差异 109

    5.3 贝叶斯定理 112

    5.4 预测回归 114

    5.5 方差分析 118

    5.6 对数回归 120

    5.7 对数-线性模型 121

    5.8 线性判别分析 124

    5.9 复习题 126

    5.10 参考书目 128

    第6章 决策树和决策规则 131

    6.1 决策树 132

    6.2 C4.5算法:生成决策树 134

    6.3 未知属性值 139

    6.4 修剪决策树 142

    6.5 C4.5算法:生成决策规则 143

    6.6 CART算法和Gini指标 146

    6.7 决策树和决策规则的

    局限性 148

    6.8 复习题 150

    6.9 参考书目 153

    第7章 人工神经网络 155

    7.1 人工神经元的模型 156

    7.2 人工神经网络的结构 159

    7.3 学习过程 161

    7.4 使用ANN完成的

    学习任务 164

    7.4.1 模式联想 164

    7.4.2 模式识别 164

    7.5 多层感知机 166

    7.6 竞争网络和竞争学习 172

    7.7 SOM 174

    7.8 复习题 178

    7.9 参考书目 180

    第8章 集成学习 183

    8.1 集成学习方法论 184

    8.2 多学习器组合方案 187

    8.3 bagging和boosting 188

    8.4 AdaBoost算法 189

    8.5 复习题 190

    8.6 参考书目 193

    第9章 聚类分析 195

    9.1 聚类的概念 195

    9.2 相似度的度量 198

    9.3 凝聚层次聚类 203

    9.4 分区聚类 206

    9.5 增量聚类 208

    9.6 DBSCAN算法 211

    9.7 BIRCH 算法 213

    9.8 聚类验证 215

    9.9 复习题 215

    9.10 参考书目 218

    第10章 关联规则 221

    10.1 购物篮分析 222

    10.2 Apriori 算法 223

    10.3 从频繁项集中得到

    关联规则 225

    10.4 提高Apriori算法的效率 226

    10.5 FP增长方法 227

    10.6 关联分类方法 229

    10.7 多维关联规则挖掘 231

    10.8 复习题 232

    10.9 参考书目 236

    第11章 Web挖掘和文本挖掘 237

    11.1 Web挖掘 237

    11.2 Web内容、结构与

    使用挖掘 238

    11.3 HITS和LOGSOM算法 240

    11.4 挖掘路径遍历模式 245

    11.5 PageRank算法 247

    11.6 文本挖掘 249

    11.7 潜在语义分析 252

    11.8 复习题 255

    11.9 参考书目 257

    第12章 数据挖掘高级技术 259

    12.1 图挖掘 259

    12.2 时态数据挖掘 270

    12.2.1 时态数据表示 271

    12.2.2 序列之间的相似性

    度量 274

    12.2.3 时态数据模型 276

    12.2.4 数据挖掘 277

    12.3 空间数据挖掘(SDM) 281

    12.4 分布式数据挖掘(DDM) 284

    12.5 关联并不意味着存在

    因果关系 290

    12.6 数据挖掘的隐私、安全及

    法律问题 295

    12.7 复习题 299

    12.8 参考书目 300

    第13章 遗传算法 303

    13.1 遗传算法的基本原理 304

    13.2 用遗传算法进行优化 305

    13.2.1 编码方案和初始化 306

    13.2.2 适合度估计 306

    13.2.3 选择 307

    13.2.4 交叉 308

    13.2.5 突变 308

    13.3 遗传算法的简单例证 310

    13.3.1 表述 310

    13.3.2 初始群体 311

    13.3.3 评价 311

    13.3.4 交替 312

    13.3.5 遗传算子 312

    13.3.6 评价(第二次迭代) 313

    13.4 图式 314

    13.5 旅行推销员问题 316

    13.6 使用遗传算法的

    机器学习 318

    13.6.1 规则交换 320

    13.6.2 规则概化 320

    13.6.3 规则特化 321

    13.6.4 规则分割 321

    13.7 遗传算法用于聚类 321

    13.8 复习题 323

    13.9 参考书目 324

    第14章 模糊集和模糊逻辑 327

    14.1 模糊集 327

    14.2 模糊集的运算 332

    14.3 扩展原理和模糊关系 335

    14.4 模糊逻辑和模糊

    推理系统 339

    14.5 多因子评价 342

    14.6 从数据中提取模糊模型 344

    14.7 数据挖掘和模糊集 349

    14.8 复习题 350

    14.9 参考书目 352

    第15章 可视化方法 353

    15.1 感知和可视化 353

    15.2 科学可视化和信息

    可视化 354

    15.3 平行坐标 359

    15.4 放射性可视化 361

    15.5 使用自组织映射进行

    可视化 363

    15.6 数据挖掘的可视化系统 365

    15.7 复习题 368

    15.8 参考书目 369

    附录A 数据挖掘工具 371

    附录B 数据挖掘应用 393

    资源截图:

    1.png


    PY源码网云资源 » 数据挖掘-概念模型方法和算法 第2版_数据结构教程

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    • 423510会员总数(位)
    • 40983资源总数(个)
    • 10 今日发布(个)
    • 1728稳定运行(天)

    提供最优质的资源集合

    立即查看 了解详情