数据挖掘原理与技术

副标题:无

作   者:张云涛,龚玲著

分类号:

ISBN:9787505397385

微信扫一扫,移动浏览光盘

简介

   数据挖掘将数据转化为知识,是数据管理、信息处理领域研究、开发和应用的最活跃的分支之一。本书全面地论述了数据挖掘领域的基本概念、基本原理和基本方法,内容包括数据挖掘领域的经典理论和前沿发展。全书共分14章,并含有1个附录。全面系统地介绍了数据挖掘的概念和过程、数据预处理技术;深入地叙述了各种数据挖掘技术,包括关联规则、决策树、聚类、基于样例的学习、贝叶斯学习、粗糙集、神经网络、遗传算法、统计分析;并讨论了数据挖掘的典型应用,如分类、文本和Web挖掘,以及数据挖掘的应用和发展趋势;并在第14章中给出了一个具体的商业智能解决方案实例。    通过本书的学习,读者可以对数据挖掘的整体结构、概念、原理、技术和发展有深入的了解和认识。    本书既可以作为相关专业的高年级本科生和研究生教材,也可作为数据挖掘领域的研究者和开发者的参考书。   

目录

第1章 绪论


1-1 什么是数据挖掘

1-2 为何进行数据挖掘

1-3 数据挖掘和统计分析的关系

1-4 数据挖掘与数据仓库的关系

1-5 数据挖掘系统和其他系统的比较

1-5-1 数据挖掘系统与专家系统的比较

1-5-2 数据挖掘和olap的比较

1-6 数据挖掘系统的分类


第2章 数据挖掘过程


2-1 问题定义与主题分析

2-2 数据准备

2-2-1 数据清理

2-2-2 数据集成

2-2-3 数据选择

2-2-4 数据变换

2-2-5 数据归约

.2-2-6 数据质量分析

2-3 建立模型

2-3-1 模型是什么

2-3-2 模型的精确度

2-3-3 模型的验证

2-4 模式评估

2-4-1 模式是什么

2-4-2 挖掘结果的评价和验证

2-5 数据可视化和知识管理

2-5-1 可视化表示

2-5-2 知识管理


第3章 关联规则


3-1 概述

3-1-1 啤酒和尿布问题

3-1-2 基本概念

3-2 关联规则

3-2-1 概念分层

3-2-2 兴趣度

3-2-3 数据库中关联规则的发现

3-3 关联规则学习的apriori算法

3-3-1 使用候选项集找频繁项集

3-3-2 由频繁项集产生关联规则

3-4 挖掘关联规则的多策略方法

3-4-1 多层关联规则

3-4-2 多维关联规则


第4章 决策树


4-1 什么是决策树

4-2 决策树的原理

4-2-1 归纳学习

4-2-2 决策树的表示

4-2-3 决策树学习

4-2-4 id3算法

4-2-5 树剪枝

4-3 决策树的应用

4-3-1 规则提取

4-3-2 分类

4-4 决策树的优缺点


第5章 聚类分析


5-1 概述

5-1-1 什么是聚类分析

5-1-2 聚类分析的预备知识

5-1-3 聚类方法的分类

5-2 基于划分的聚类算法

5-2-1 基于划分的评价函数

5-2-2 k-平均方法

5-2-3 k-中心点方法

5-3 层次聚类

5-3-1 凝聚方法

5-3-2 分裂方法

5-4 孤立点分析

5-4-1 基于统计的孤立点检测

5-4-2 基于距离的孤立点检测

5-4-3 基于偏离的孤立点检测


第6章 基于样例的学习


6-1 概述

6-2 k-最近邻算法

6-2-1 基本思想

6-2-2 k-最近邻算法

6-2-3 距离加权最近邻算法

6-3 基于样例的推理

6-3-1 cbr过程

6-3-2 样例的表示

6-3-3 相似性关系

6-3-4 样例的修正和调整


第7章 贝叶斯学习


7-1 贝叶斯理论

7-1-1 贝叶斯理论的基本理念

7-1-2 贝叶斯定理

7-1-3 极大似然和最小误差平方假设

7-2 相素贝叶斯分类

7-3 贝叶斯信念网络

7-3-1 贝叶斯信念网络的结构

7-3-2 贝叶斯信念网络的训练

7-4 贝叶斯分类的应用


第8章 粗糙集


8-1 关于知识的观点

8-2 粗糙集理论的知识发现

8-3 决策表的定义

8-4 数据离散化

8-5 决策规则的获取

8-6 粗糙集的化简

8-6-1 属性的化简

8-6-2 一致决策的化简

8-6-3 属性重要性试题


第9章 神经网络


9-1 什么是神经网络

9-2 神经网络的表示和学习

9-2-1 基本神经元模型

9-2-2 基本的神经网络模型

9-2-3 感知器

9-2-4 神经网络的学习

9-3 多层前馈神经网络

9-3-1 前馈神经网络模型和表征能力

9-3-2 后向传播算法

9-3-3 后向传播法则的推导

9-4 反馈式神经网络

9-4-1 离散型神经网络

9-4-2 连续型神经网络

9-5 神经网络的应用之一——聚类


第10章 遗传算法


10-1 遗传算法概述

10-1-1 基本思想和术语

10-1-2 遗传算法的基础

10-1-3 遗传算法的特点

10-2 基本遗传算法

10-3 遗传算法的实现技术

10-3-1 编码方法

10-3-2 适应性度量

10-3-3 选择策略

10-3-4 交叉和变变异遗传算子

10-4 遗传算法的理论分析

10-4-1 模式定理

10-4-2 积木块假设与欺骗问题

10-4-3 隐并行性

10-4-4 遗传算法的收敛性分析

10-5 遗传算法的应用实例


第11章 统计分析


11-1 样本和统计推理

11-1-1 通过概率分布和密度描述数据

11-1-2 置信区间的推导

11-2 回归分析

11-2-1 具有线性结构的回归模型

11-2-2 最小二乘法拟合

11-2-3 多元线性回归

11-2-4 非线性回归数据分析

11-3 及成分分析

11-3-1 高维数据综合简化的思想和原则

11-3-2 主成分分析的算法推导


第12章 文本和web挖掘


12-1 概述

12-1-1 文本挖掘的任务

12-1-2 web挖掘的特点

12-1-3 web挖掘的任务

12-2 文本挖掘技术

12-2-1 文本的向量空间表示

12-2-2 文本特征的提取

12-2-3 文本信息挖掘系统

12-3 web数据挖掘技术

12-3-1 web结构挖掘

12-3-2 web使用记录的挖掘

12-3-3 web内容挖掘

12-3-4 个人偏好建模

12-4 文本和web挖掘的应用

12-4-1 文档分类

12-4-2 自动推荐系统


第13章 数据挖掘的应用和发展趋势


13-1 空间数据挖掘

13-1-1 空间数据库

13-1-2 空间数据挖掘发现的知识类型

13-1-3 空间数据挖掘方法

13-2 图像检索和挖掘

13-2-1 基于内容的检索

13-2-2 图像数据库挖掘

13-3 时间序列和序列检索

13-3-1 序列模式分析

13-3-2 时间序列数据

13-3-3 趋势分析

13-3-4 时序分析

13-4 隐私面临的挑战


第14章 商业智能解决方案实例分析


14-1 商业智能概述

14-1-1 传统的信息系统的不足

14-1-2 什么是商业智能

14-2 商业智能系统的处理流程和框架

14-2-1 商业智能系统的处理流程

14-2-2 商业智能系统的框架

14-3 商业智能解决方案

14-3-1 概述

14-3-2 数据仓库

14-3-3 数据仓库管理

14-3-4 数据清洗和转换

14-3-5 在线分析

14-3-6 前端工具

14-3-7 数据挖掘


附录a ibm db2 intelligent miner简介


a-1 db2 intelligent miner功能简介

a-2 db2 intelligent miner for data使用简介

a-2-1 业务定义

a-2-2 定义数据对象

a-3 创建模型

a-4 模型应用

a-5 创建统计函数

a-6 解释挖掘结果


参考文献

已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

数据挖掘原理与技术
    • 名称
    • 类型
    • 大小

    光盘服务联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    loading icon