微信扫一扫,移动浏览光盘
简介
数据仓库与数据挖掘都是从数据资源提取信息和知识进行辅助决策。由于数据资源丰富,数据仓库与数据挖掘辅助决策效果十分显著。
本书系统介绍数据仓库原理、联机分析处理、数据仓库设计与开发、数据仓库的决策支持应用,数据挖掘原理、信息论的决策树方法、集合论的粗糙集方法、关联规则、公式发现、神经网络、遗传算法、文本挖掘与Web挖掘,以及数据仓库与数据挖掘的发展。
本书对数据仓库的系统介绍,在于突出决策支持的本质。对数据挖掘的各类方法均介绍了它们的理论基础和实现方法,并通过例子进行了说明。
本书的特点是从数据仓库和数据挖掘的兴起与演变来说明它们的本质,通过实例来解释它们的原理,这样便于读者学习和掌握,适于本科生和研究生使用。
目录
第1章 数据仓库与数据挖掘概述1
1.1 数据仓库的兴起.1
1.1.1 从数据库到数据仓库1
1.1.2 从oltp到olap3
1.1.3 数据字典与元数据4
1.1.4 数据仓库的定义与特点6
1.2 数据挖掘的兴起7
1.2.1 从机器学习到数据挖掘7
1.2.2 数据挖掘的含义8
1.2.3 数据挖掘与olap的比较8
1.2.4 数据挖掘与统计学9
1.3 数据仓库和数据挖掘的结合11
1.3.1 数据仓库和数据挖掘的区别与联系11
1.3.2 基于数据仓库的决策支持系统13
1.3.3 数据仓库与商业智能14
习题16
第2章 数据仓库原理17
2.1 数据仓库结构体系17
2.1.1 数据仓库结构17
2.1.2 数据集市及其结构18
.2.1.3 数据仓库系统结构21
2.1.4 数据仓库的运行结构22
2.2 数据仓库的数据模型23
2.2.1 星型模型24
2.2.2 雪花模型25
2.2.3 星网模型25
2.2.4 第三范式26
2.3 数据抽取、转换和装载27
2.3.1 数据抽取27
2.3.2 数据转换28
2.3.3 数据装载30
2.3.4 etl工具31
2.4 元数据32
2.4.1 元数据的重要性32
2.4.2 关于数据源的元数据33
2.4.3 关于数据模型的元数据33
2.4.4 关于数据仓库映射的元数据35
2.4.5 关于数据仓库使用的元数据36
习题36
第3章 联机分析处理38
3.1 olap概念38
3.1.1 olap的定义38
3.1.2 olap准则39
3.1.3 olap的基本概念42
3.2 olap的数据模型43
3.2.1 molap数据模型43
3.2.2 rolap数据模型45
3.2.3 molap与rolap的比较45
3.2.4 holap数据模型48
3.3 多维数据的显示48
3.3.1 多维数据的显示方法48
3.3.2 多维类型结构49
3.3.3 多维数据的分析视图50
3.4 olap的多维数据分析52
3.4.1 多维数据分析的基本操作52
3.4.2 广义olap功能54
3.4.3 多维数据分析实例56
3.5 olap结构与分析工具58
3.5.1 olap结构58
3.5.2 olap的web结构59
3.5.3 olap工具及评价61
习题63
第4章 数据仓库设计与开发65
4.1 数据仓库分析与设计65
4.1.1 需求分析65
4.1.2 概念模型设计67
4.1.3 逻辑模型设计68
4.1.4 物理模型设计73
4.1.5 数据仓库的索引技术75
4.2 数据仓库开发79
4.2.1 数据仓库开发过程79
4.2.2 数据质量与数据清洗85
4.2.3 数据粒度与维度建模86
4.3 数据仓库技术与开发的困难88
4.3.1 数据仓库技术88
4.3.2 数据仓库开发的困难92
习题93
第5章 数据仓库管理和应用95
5.1 数据仓库管理95
5.1.1 用户使用数据仓库的管理95
5.1.2 数据管理98
5.2 数据仓库的决策支持与决策支持系统103
5.2.1 查询与报表104
5.2.2 多维分析与原因分析105
5.2.3 预测未来106
5.2.4 实时决策106
5.2.5 自动决策107
5.2.6 决策支持系统108
5.3 数据仓库应用实例109
5.3.1 航空公司数据仓库决策支持系统简例109
5.3.2 统计业数据仓库系统114
5.3.3 沃尔玛数据仓库系统116
习题118
第6章 数据挖掘原理120
6.1 知识发现过程120
6.1.1 知识发现过程定义120
6.1.2 数据挖掘对象121
6.1.3 数据挖掘任务123
6.1.4 数据挖掘分类125
6.1.5 不完全数据处理127
6.1.6 数据库的数据浓缩128
6.2 数据挖掘方法和技术..131
6.2.1 归纳学习的信息论方法131
6.2.2 归纳学习的集合论方法131
6.2.3 仿生物技术的神经网络方法132
6.2.4 仿生物技术的遗传算法133
6.2.5 数值数据的公式发现133
6.2.6 可视化技术134
6.3 数据挖掘的知识表示134
6.3.1 规则知识134
6.3.2 决策树知识135
6.3.3 知识基135
6.3.4 神经网络的权值136
6.3.5 公式知识136
6.3.6 案例137
习题137
第7章 信息论方法139
7.1 信息论原理139
7.1.1 信道模型和学习信道模型139
7.1.2 信息熵和条件熵140
7.1.3 互信息与信息增益141
7.1.4 信道容量与译码准则142
7.2 决策树方法143
7.2.1 决策树概念143
7.2.2 id3方法基本思想144
7.2.3 id3算法145
7.2.4 实例与讨论146
7.2.5 c4.5方法148
7.3 决策规则树方法151
7.3.1 ible方法的基本思想151
7.3.2 ible算法153
7.3.3 ible方法实例155
习题161
第8章 集合论方法163
8.1 粗糙集方法163
8.1.1 粗糙集概念163
8.1.2 属性约简的粗糙集理论166
8.1.3 属性约简的粗糙集方法172
8.1.4 粗糙集方法的规则获取173
8.1.5 粗糙集方法的应用实例174
8.2 关联规则挖掘176
8.2.1 关联规则的挖掘原理177
8.2.2 apriori算法的基本思想180
8.2.3 apriori算法程序183
8.2.4 基于fp-树的关联规则挖掘算法184
习题188
第9章 公式发现189
9.1 公式发现概述189
9.1.1 曲线拟合与公式发现189
9.1.2 启发式与数据驱动启发式191
9.2 科学定律重新发现系统193
9.2.1 bacon系统基本原理193
9.2.2 bacon系统实例194
9.2.3 bacon系统的进展196
9.3 经验公式发现系统197
9.3.1 fdd系统基本原理197
9.3.2 fdd.1系统结构199
9.3.3 fdd.1系统实例202
9.3.4 fdd.2系统204
9.3.5 fdd.3系统207
习题211
第10章 神经网络与遗传算法213
10.1 神经网络概念及几何意义213
10.1.1 神经网络原理213
10.1.2 神经网络的几何意义214
10.1.3 超曲面神经网络概念216
10.2 感知机218
10.2.1 感知机模型218
10.2.2 感知机实例219
10.2.3 感知机讨论220
10.3 反向传播模型221
10.3.1 bp网络结构221
10.3.2 bp网络学习公式推导221
10.3.3 实例分析226
10.4 遗传算法228
10.4.1 遗传算法基本原理229
10.4.2 遗传算子231
10.4.3 遗传算法简例 234
10.4.4 遗传算法的特点236
10.5 基于遗传算法的分类学习系统237
10.5.1 概述237
10.5.2 遗传分类学习系统gcls的基本原理238
10.5.3 遗传分类学习系统gcls的应用242
习题243
第11章 文本挖掘与web挖掘245
11.1 文本挖掘概述245
11.1.1 文本挖掘的基本概念245
11.1.2 文本特征的表示246
11.1.3 文本特征的提取247
11.2 文本挖掘248
11.2.1 文本挖掘功能层次248
11.2.2 关联分析248
11.2.3 文本聚类249
11.2.4 文本分类250
11.3 web挖掘251
11.3.1 web挖掘概述251
11.3.2 web内容挖掘253
11.3.3 web结构挖掘255
11.3.4 web应用挖掘258
习题261
第12章 数据仓库与数据挖掘的发展262
12.1 综合决策支持系统262
12.1.1 从管理科学到决策支持系统262
12.1.2 基于数据仓库的决策支持系统与传统决策支持系统的结合265
12.1.3 综合决策支持系统发展趋势268
12.2 可拓数据挖掘270
12.2.1 可拓学基本原理270
12.2.2 从数据挖掘到可拓数据挖掘272
12.2.3 可拓数据挖掘理论272
12.2.4 可拓数据挖掘实例274
习题...277
参考文献278
1.1 数据仓库的兴起.1
1.1.1 从数据库到数据仓库1
1.1.2 从oltp到olap3
1.1.3 数据字典与元数据4
1.1.4 数据仓库的定义与特点6
1.2 数据挖掘的兴起7
1.2.1 从机器学习到数据挖掘7
1.2.2 数据挖掘的含义8
1.2.3 数据挖掘与olap的比较8
1.2.4 数据挖掘与统计学9
1.3 数据仓库和数据挖掘的结合11
1.3.1 数据仓库和数据挖掘的区别与联系11
1.3.2 基于数据仓库的决策支持系统13
1.3.3 数据仓库与商业智能14
习题16
第2章 数据仓库原理17
2.1 数据仓库结构体系17
2.1.1 数据仓库结构17
2.1.2 数据集市及其结构18
.2.1.3 数据仓库系统结构21
2.1.4 数据仓库的运行结构22
2.2 数据仓库的数据模型23
2.2.1 星型模型24
2.2.2 雪花模型25
2.2.3 星网模型25
2.2.4 第三范式26
2.3 数据抽取、转换和装载27
2.3.1 数据抽取27
2.3.2 数据转换28
2.3.3 数据装载30
2.3.4 etl工具31
2.4 元数据32
2.4.1 元数据的重要性32
2.4.2 关于数据源的元数据33
2.4.3 关于数据模型的元数据33
2.4.4 关于数据仓库映射的元数据35
2.4.5 关于数据仓库使用的元数据36
习题36
第3章 联机分析处理38
3.1 olap概念38
3.1.1 olap的定义38
3.1.2 olap准则39
3.1.3 olap的基本概念42
3.2 olap的数据模型43
3.2.1 molap数据模型43
3.2.2 rolap数据模型45
3.2.3 molap与rolap的比较45
3.2.4 holap数据模型48
3.3 多维数据的显示48
3.3.1 多维数据的显示方法48
3.3.2 多维类型结构49
3.3.3 多维数据的分析视图50
3.4 olap的多维数据分析52
3.4.1 多维数据分析的基本操作52
3.4.2 广义olap功能54
3.4.3 多维数据分析实例56
3.5 olap结构与分析工具58
3.5.1 olap结构58
3.5.2 olap的web结构59
3.5.3 olap工具及评价61
习题63
第4章 数据仓库设计与开发65
4.1 数据仓库分析与设计65
4.1.1 需求分析65
4.1.2 概念模型设计67
4.1.3 逻辑模型设计68
4.1.4 物理模型设计73
4.1.5 数据仓库的索引技术75
4.2 数据仓库开发79
4.2.1 数据仓库开发过程79
4.2.2 数据质量与数据清洗85
4.2.3 数据粒度与维度建模86
4.3 数据仓库技术与开发的困难88
4.3.1 数据仓库技术88
4.3.2 数据仓库开发的困难92
习题93
第5章 数据仓库管理和应用95
5.1 数据仓库管理95
5.1.1 用户使用数据仓库的管理95
5.1.2 数据管理98
5.2 数据仓库的决策支持与决策支持系统103
5.2.1 查询与报表104
5.2.2 多维分析与原因分析105
5.2.3 预测未来106
5.2.4 实时决策106
5.2.5 自动决策107
5.2.6 决策支持系统108
5.3 数据仓库应用实例109
5.3.1 航空公司数据仓库决策支持系统简例109
5.3.2 统计业数据仓库系统114
5.3.3 沃尔玛数据仓库系统116
习题118
第6章 数据挖掘原理120
6.1 知识发现过程120
6.1.1 知识发现过程定义120
6.1.2 数据挖掘对象121
6.1.3 数据挖掘任务123
6.1.4 数据挖掘分类125
6.1.5 不完全数据处理127
6.1.6 数据库的数据浓缩128
6.2 数据挖掘方法和技术..131
6.2.1 归纳学习的信息论方法131
6.2.2 归纳学习的集合论方法131
6.2.3 仿生物技术的神经网络方法132
6.2.4 仿生物技术的遗传算法133
6.2.5 数值数据的公式发现133
6.2.6 可视化技术134
6.3 数据挖掘的知识表示134
6.3.1 规则知识134
6.3.2 决策树知识135
6.3.3 知识基135
6.3.4 神经网络的权值136
6.3.5 公式知识136
6.3.6 案例137
习题137
第7章 信息论方法139
7.1 信息论原理139
7.1.1 信道模型和学习信道模型139
7.1.2 信息熵和条件熵140
7.1.3 互信息与信息增益141
7.1.4 信道容量与译码准则142
7.2 决策树方法143
7.2.1 决策树概念143
7.2.2 id3方法基本思想144
7.2.3 id3算法145
7.2.4 实例与讨论146
7.2.5 c4.5方法148
7.3 决策规则树方法151
7.3.1 ible方法的基本思想151
7.3.2 ible算法153
7.3.3 ible方法实例155
习题161
第8章 集合论方法163
8.1 粗糙集方法163
8.1.1 粗糙集概念163
8.1.2 属性约简的粗糙集理论166
8.1.3 属性约简的粗糙集方法172
8.1.4 粗糙集方法的规则获取173
8.1.5 粗糙集方法的应用实例174
8.2 关联规则挖掘176
8.2.1 关联规则的挖掘原理177
8.2.2 apriori算法的基本思想180
8.2.3 apriori算法程序183
8.2.4 基于fp-树的关联规则挖掘算法184
习题188
第9章 公式发现189
9.1 公式发现概述189
9.1.1 曲线拟合与公式发现189
9.1.2 启发式与数据驱动启发式191
9.2 科学定律重新发现系统193
9.2.1 bacon系统基本原理193
9.2.2 bacon系统实例194
9.2.3 bacon系统的进展196
9.3 经验公式发现系统197
9.3.1 fdd系统基本原理197
9.3.2 fdd.1系统结构199
9.3.3 fdd.1系统实例202
9.3.4 fdd.2系统204
9.3.5 fdd.3系统207
习题211
第10章 神经网络与遗传算法213
10.1 神经网络概念及几何意义213
10.1.1 神经网络原理213
10.1.2 神经网络的几何意义214
10.1.3 超曲面神经网络概念216
10.2 感知机218
10.2.1 感知机模型218
10.2.2 感知机实例219
10.2.3 感知机讨论220
10.3 反向传播模型221
10.3.1 bp网络结构221
10.3.2 bp网络学习公式推导221
10.3.3 实例分析226
10.4 遗传算法228
10.4.1 遗传算法基本原理229
10.4.2 遗传算子231
10.4.3 遗传算法简例 234
10.4.4 遗传算法的特点236
10.5 基于遗传算法的分类学习系统237
10.5.1 概述237
10.5.2 遗传分类学习系统gcls的基本原理238
10.5.3 遗传分类学习系统gcls的应用242
习题243
第11章 文本挖掘与web挖掘245
11.1 文本挖掘概述245
11.1.1 文本挖掘的基本概念245
11.1.2 文本特征的表示246
11.1.3 文本特征的提取247
11.2 文本挖掘248
11.2.1 文本挖掘功能层次248
11.2.2 关联分析248
11.2.3 文本聚类249
11.2.4 文本分类250
11.3 web挖掘251
11.3.1 web挖掘概述251
11.3.2 web内容挖掘253
11.3.3 web结构挖掘255
11.3.4 web应用挖掘258
习题261
第12章 数据仓库与数据挖掘的发展262
12.1 综合决策支持系统262
12.1.1 从管理科学到决策支持系统262
12.1.2 基于数据仓库的决策支持系统与传统决策支持系统的结合265
12.1.3 综合决策支持系统发展趋势268
12.2 可拓数据挖掘270
12.2.1 可拓学基本原理270
12.2.2 从数据挖掘到可拓数据挖掘272
12.2.3 可拓数据挖掘理论272
12.2.4 可拓数据挖掘实例274
习题...277
参考文献278
数据仓库与数据挖掘教程[电子资源.图书]
- 名称
- 类型
- 大小
光盘服务联系方式: 020-38250260 客服QQ:4006604884
云图客服:
用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问
Video Player
×
Audio Player
×
pdf Player
×