作者:(新西兰)威滕(Witten,I.H.),(新西兰)弗兰克(Frank,E.),董琳 页数:363 出版社:机械工业出版社 |
本书介绍数据挖掘的基本理论与实践方法。主要内容包括:各种模型(决策树,关联规则、线性模型、聚类、贝叶斯网以及神经网络)以及在实践中的运用,所存任缺陷的分析。安全地清理数据集、建立以及评估模型的预测质量的方法,并且提供了一个公开的数据挖掘工作平台Weka。Weka系统拥有进行数据挖掘仟务的图形用户界面,有助于理解模型,是一个实用并且深受欢迎的工具。
本书适合作为高等学校本科生或研究生的教材,也可供相关技术人员参考。
Ian H.Witten,新西兰怀卡托大学计算机科学系教授,ACM和新西兰皇(IFIP)颁发的Namur奖项。他的著作包括《Managing Gigabytes:Compressing and Indexing Documents and Images》、《How to Build a Digital Library》以及众多的期刊和学会文章。
出版者的话
专家指导委员会
译者序
中文版前言
序
前言
第一部分 机器学习工具与技术
第1章 绪论
1.l 数据挖掘和机器学习
l.2 简单的例子:天气问题和其他
l.3 应用领域-
1.4 机器学习和统计学
1.5 用于搜索的概括
l.6 数据挖掘和道德
1.7 补允读物
第2章 输入概念、实例和属性
2.1 概念
2.2 样本
2.3 属性
2.4 输入准备
2.5 补充读物
第3章 输出:知识表达
3.1 决策表
3.2 决策树
3.3 分类规则
3.4 关联规则
3.5 包含例外的规则
3.6 包含关系的规则
3.7 数值预测树
3.8 基于实例的表达
3.9 聚类
3.10 补充读物
第4章 算法基本方法
4.1 推断基本规则
4.2 统计建模
4.3 分治法:创建决策树
4.4 覆盖算法:建立规则
4.5 挖掘关联规州
4.6 线性模型
4.7 基于实例的学习
4.8 聚类
4.9 补充读物
第5章 可信度:评估机器学习结果
5.1 训练和测试
5.2 预测性能
5.3 交叉验证
5.4 其他估计法
5.5 可信度:评估机器学习结果
5.6 预测概率
5.7 计算成本
5.8 评估数值预测
5.9 最短描述长度原理
5.10 聚类方法中应用MDL原理
5.1l 补充读物
第6章 实现:真正的机器学习方案
……
第7章 转换:处理输入和输出
第8章 继续扩展和应用
第9章 Weka简介
第10章 Explorer界面
第1l章 Knowledge Flow界面
第12章 Experimenter界面
第13章 命令行界面
第14章 嵌入式机器学习
第15章 编写新学习方案
参考文献
索引