简介
知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据矿山中找到蕴藏的知识金块,将为知识创新和知识经济的发展作出贡献。
本书全面而又系统地介绍了知识发现的方法和技术,反映了当前知识发现研究的最新成果。
全书共分11章。第1章是绪论,介绍知识发现的重要概念和任务。第2章讨论决策树,它是归纳学习方法中最实用的一种技术。关联规则挖掘是近几年应用最为广泛的方法,第3章将对重要的关联规则挖掘算法进行讨论。第4章讨论范例推理,它是一种有效的实用技术。第5章探讨模糊聚类法。第6章讨论粗糙集。第7章是贝叶斯网络,贝叶斯网络可以处理不完整和带有噪声的数据集,它用概率测度的权重来描述数据间的相关性。第8章探讨支持向量机,它在近几年知识发现研究中是极其活跃的研究课题。第9章讨论隐马尔科夫模型。第10章是神经网络,书中着重介绍几种实用的算法。第11章讨论进化和遗传算法。第12章介绍知识发现平台MSMiner。接着,以Web知识发现、生物信息处理为例,介绍知识发现的应用。第13章关于Web知识发现。第14章介绍生物信息处理中基因组模式的发现。
本书内容新颖,认真总结了作者的科研成果,取材国内外最新资料,反映了当前该领域的研究水平。论述力求概念清晰,表达准确,突出理论联系实际,通过实例说明原理,富有启发性。本书对从事知识发现、数据挖掘、机器学习、人工智能研究和知识管理的科技人员具有重要参考价值,可以用作计算机、信息技术等专业博士生、硕士生的教材。
目录
前言 3页
第 1 章 绪论 15页
1.1 知识 15页
1.2 知识发现 16页
1.3 知识发现的任务 18页
1.3.1 数据总结 18页
1.3.2 概念描述 19页
1.3.3 分类 19页
1.3.4 聚类 20页
1.3.5 相关性分析 20页
1.3.6 偏差分析 20页
1.3.7 建模 21页
1.4 知识发现的方法 21页
1.4.1 统计方法 21页
1.4.2 机器学习 23页
1.4.3 神经计算 25页
1.4.4 可视化 26页
1.5 知识发现的对象 27页
1.5.1 数据库 27页
1.5.2 文本 28页
1.5.3 Web 信息 29页
1.5.4 空间数据 29页
1.5.5 图像和视频数据 30页
1.6 知识发现与创新 31页
第 2 章 决策树 35页
2.1 归纳学习 35页
2.2 决策树学习 35页
2.3 CLS 学习算法 37页
2.4 ID3 学习算法 38页
2.4.1 信息论简介 38页
2.4.2 信息论在决策树学习中的意义及应用 39页
2.4.3 ID3 算法 40页
2.4.4 ID3 算法应用举例 40页
2.5 决策树的改进算法 42页
2.5.1 二叉树判定算法 42页
2.5.2 按信息比值进行估计的方法 43页
2.5.3 按分类信息估值 43页
2.5.4 按划分距离估值的方法 44页
2.6 决策树的评价 45页
2.7 简化决策树 46页
2.7.1 简化决策树的动机 47页
2.7.2 决策树过大的原因 47页
2.7.3 控制树的大小 48页
2.7.4 修改测试属性空间 50页
2.7.5 改进测试属性选择方法 52页
2.7.6 对数据进行限制 54页
2.7.7 改变数据结构 55页
2.8 连续型属性离散化 58页
2.9 基于偏置变换的决策树学习算法 BSDT 59页
2.9.1 偏置的形式化 60页
2.9.2 表示偏置变换 61页
2.9.3 算法描述 62页
2.9.4 过程偏置变换 63页
2.9.5 基于偏置变换的决策树学习算法 BSDT 65页
2.9.6 经典范例库维护算法 TCBM 65页
2.9.7 偏置特征抽取算法 66页
2.9.8 改进的决策树生成算法 GSD 67页
2.9.9 实验结果 69页
2.10 归纳学习中的问题 70页
第 3 章 关联规则 71页
3.1 关联规则挖掘概述 71页
3.1.1 关联规则的意义和度量 71页
3.1.2 经典的挖掘算法 73页
3.2 广义模糊关联规则的挖掘 75页
3.3 挖掘关联规则的数组方法 78页
3.4 任意多表间关联规则的并行挖掘 79页
3.4.1 问题的形式描述 79页
3.4.2 单表内大项集的并行计算 80页
3.4.3 任意多表间大项集的生成 81页
3.4.4 跨表间关联规则的提取 82页
3.5 基于分布式系统的关联规则挖掘算法 82页
3.5.1 候选集的生成 84页
3.5.2 候选数据集的局部剪枝 85页
3.5.3 候选数据集的全局剪枝 87页
3.5.4 合计数轮流检测 89页
3.5.5 分布式挖掘关联规则的算法 90页
3.6 词性标注规则的挖掘算法与应用 92页
3.6.1 汉语词性标注 92页
3.6.2 问题的描述 93页
3.6.3 挖掘算法 94页
3.6.4 试验结果 97页
第 4 章 基于范例的推理 99页
4.1 概述 99页
4.2 过程模型 100页
4.3 范例的表示 102页
4.3.1 语义记忆单元 103页
4.3.2 记忆网 103页
4.4 范例的索引 105页
4.5 范例的检索 106页
4.6 相似性关系 107页
4.6.1 语义相似性 108页
4.6.2 结构相似性 108页
4.6.3 目标特征 108页
4.6.4 个体相似性 109页
4.6.5 相似性计算 109页
4.7 范例的复用 110页
4.8 范例的保存 112页
4.9 基于例示的学习 113页
4.9.1 基于例示学习的任务 113页
4.9.2 IB1 算法 114页
4.9.3 降低存储要求 116页
4.10 范例工程 118页
4.11 范例约简算法 120页
4.12 中心渔场预报专家系统 123页
4.12.1 问题分析与范例表示 123页
4.12.2 相似性度量 125页
4.12.3 索引与检索 125页
4.12.4 基于框架的修正 126页
4.12.5 实验结果 128页
第 5 章 模糊聚类 130页
5.1 概述 130页
5.1.1 聚类结果的表示 130页
5.1.2 模糊聚类的一般模型 130页
5.2 传递闭包法 131页
5.2.1 模糊相似系数的标定 131页
5.2.2 传递闭包法 134页
5.2.3 动态直接聚类法 134页
5.2.4 最大树法 135页
5.3 FCMBP 聚类法 136页
5.3.1 问题背景 136页
5.3.2 Fuzzy等价标准型 138页
5.3.3 置换等价类与平移等价类的记数公式 142页
5.3.4 Xn的结构 143页
5.3.5 模糊最优等价阵的存在性 144页
5.3.6 最优模糊等价阵的算法步骤 145页
5.3.7 基于 FCMBP 模糊聚类的语音识别 149页
5.4 系统聚类法 150页
5.5 C-均值聚类法 152页
5.6 聚类有效性 154页
5.7 聚类方法的比较 155页
第 6 章 粗糙集 157页
6.1 概述 157页
6.1.1 知识的分类观点 159页
6.1.2 新型的隶属关系 159页
6.1.3 概念的边界观点 160页
6.2 知识的约简 161页
6.2.1 一般约简 161页
6.2.2 相对约简 161页
6.2.3 知识的依赖性 162页
6.3 决策逻辑 163页
6.3.1 决策表的公式化定义 163页
6.3.2 决策逻辑语言 164页
6.3.3 决策逻辑语言的语义 165页
6.3.4 决策逻辑的推演 166页
6.3.5 规范表达形式 167页
6.3.6 决策规则和决策算法 167页
6.3.7 决策规则中的一致性和不分明性 168页
6.4 决策表的约简 168页
6.4.1 属性的依赖性 169页
6.4.2 一致决策表的约简 169页
6.4.3 非一致决策表的约简 174页
6.5 粗糙集的扩展模型 177页
6.5.1 可变精度粗糙集模型 178页
6.5.2 相似模型 179页
6.5.3 基于粗糙集的非单调逻辑 179页
6.5.4 与其他数学工具的结合 180页
6.6 粗糙集的实验系统 180页
6.7 粗糙集的展望 182页
第 7 章 贝叶斯网络 183页
7.1 概述 183页
7.1.1 贝叶斯网络的发展历史 183页
7.1.2 贝叶斯方法的基本观点 184页
7.1.3 贝叶斯网络在数据挖掘中的应用 184页
7.2 贝叶斯概率基础 186页
7.2.1 概率论基础 186页
7.2.2 贝叶斯概率 188页
7.3 贝叶斯学习理论 190页
7.3.1 几种常用的先验分布选取方法 191页
7.3.2 计算学习机制 193页
7.3.3 贝叶斯问题求解 195页
7.4 简单贝叶斯学习模型 197页
7.4.1 简单贝叶斯学习模型 197页
7.4.2 简单贝叶斯模型的提升 199页
7.4.3 提升简单贝叶斯分类的计算复杂性 201页
7.5 贝叶斯网络的建造 201页
7.5.1 贝叶斯网络的结构及建立方法 201页
7.5.2 学习贝叶斯网络的概率分布 202页
7.5.3 学习贝叶斯网络的网络结构 204页
7.6 贝叶斯潜在语义模型 207页
7.7 半监督文本挖掘算法 211页
7.7.1 网页聚类 211页
7.7.2 对含有潜在类别主题词的文档的类别标注 211页
7.7.3 基于简单贝叶斯模型学习标注和未标注样本 212页
第 8 章 支持向量机 218页
8.1 统计学习问题 218页
8.1.1 经验风险 218页
8.1.2 VC 维 218页
8.2 学习过程的一致性 219页
8.2.1 学习一致性的经典定义 219页
8.2.2 学习理论的重要定理 219页
8.2.3 VC 熵 220页
8.3 结构风险最小归纳原理 221页
8.4 支持向量机 223页
8.4.1 线性可分 223页
8.4.2 线性不可分 224页
8.5 核函数 226页
8.5.1 多项式核函数 226页
8.5.2 径向基函数 226页
8.5.3 多层感知机 226页
8.5.4 动态核函数 227页
8.6 基于分类超曲面的海量数据分类方法 228页
8.6.1 Jordan 曲线定理 228页
8.6.2 SVM 直接方法基本思想 229页
8.6.3 实现算法 230页
8.6.4 实验结果分析 230页
第 9 章 隐马尔科夫模型 234页
9.1 马尔科夫过程 234页
9.2 隐马尔科夫模型 235页
9.3 似然概率和前反向算法 236页
9.3.1 前向算法 237页
9.3.2 反向算法 237页
9.3.3 Viterbi算法 238页
9.3.4 计算期望 238页
9.4 学习算法 239页
9.4.1 EM 算法 239页
9.4.2 梯度下降 240页
9.4.3 Viterbi学习 241页
9.5 基于状态驻留时间的分段概率模型 241页
9.5.1 SDSPM 模型的构成 242页
第 10 章 神经网络 245页
10.1 概述 245页
10.1.1 基本的神经网络模型 245页
10.1.2 神经网络的学习方法 245页
10.2 人工神经元及感知机模型 247页
10.2.1 基本神经元 247页
10.2.2 感知机模型 248页
10.3 前向神经网络 249页
10.3.1 前向神经网络模型 249页
10.3.2 多层前向神经网络的误差反向传播(BP)算法 250页
10.3.3 BP 算法的若干改进 252页
10.4 径向基函数神经网络 256页
10.4.1 插值问题 257页
10.4.2 正规化问题 257页
10.4.3 RBF 网络学习方法 259页
10.5 反馈神经网络 262页
10.5.1 离散 Hopfield 网络 262页
10.5.2 连续 Hopfield 网络 269页
10.5.3 Hopfield网络应用 270页
10.5.4 双向联想记忆模型 271页
10.6 随机神经网络 272页
10.6.1 模拟退火算法 272页
10.6.2 玻尔兹曼机 275页
10.7 自组织特征映射神经网络 278页
10.7.1 网络的拓扑结构 278页
10.7.2 网络自组织算法 278页
10.7.3 有教师学习 279页
第 11 章 进化和遗传算法 281页
11.1 概述 281页
11.2 基本遗传算法 283页
11.2.1 基本遗传算法的构成要素 283页
11.2.2 基本遗传算法的一般框架 284页
11.3 遗传算法的数学理论 286页
11.3.1 模式定理 287页
11.3.2 积木块假设 289页
11.3.3 遗传算法欺骗问题 290页
11.3.4 隐并行性 290页
11.4 遗传算法的基本实现技术 291页
11.4.1 编码方法 291页
11.4.2 适应度函数 294页
11.4.3 选择算子 296页
11.4.4 交叉算子 298页
11.4.5 变异算子 300页
11.4.6 约束条件的处理方法 301页
11.5 遗传算法的高级实现技术 301页
11.5.1 反转操作 301页
11.5.2 变长度染色体遗传算法 302页
11.5.3 小生境遗传算法 302页
11.5.4 混合遗传算法 303页
11.5.5 改进遗传算法 306页
11.6 并行遗传算法 307页
11.7 遗传算法应用 308页
11.7.1 优化神经网络连接权值 309页
11.7.2 用遗传算法优化神经网络连接结构 309页
第 12 章 知识发现平台 M SM iner 311页
12.1 概述 311页
12.2 数据仓库 313页
12.2.1 数据仓库含义 313页
12.2.2 元数据 314页
12.2.3 OLAP 315页
12.2.4 数据仓库和数据挖掘技术的结合 315页
12.3 MSMiner的体系结构 316页
12.3.1 数据挖掘模型 316页
12.3.2 系统功能 317页
12.3.3 体系结构 318页
12.4 元数据管理 319页
12.4.1 MSMiner元数据的内容 319页
12.4.2 MSMiner元数据库 320页
12.4.3 MSMiner元数据对象模型 320页
12.5 数据仓库管理器 323页
12.5.1 MSMiner数据仓库的基本结构 324页
12.5.2 主题 325页
12.5.3 数据抽取和集成 326页
12.5.4 数据抽取和集成的元数据 329页
12.5.5 数据仓库建模及 OLAP 的实现 330页
12.6 算法库管理 334页
12.6.1 数据挖掘算法的元数据 334页
12.6.2 可扩展性的实现 335页
12.6.3 挖掘算法的接口规范 336页
12.7 数据挖掘任务规划 338页
12.7.1 面向对象的数据挖掘任务模型 338页
12.7.2 数据挖掘任务模型的处理 342页
12.8 关系数据库知识发现查询语言 KDSQL 344页
12.8.1 知识对象 344页
12.8.2 知识发现查询语言定义 345页
12.8.3 扩充的 CREATE 命令语句 346页
12.8.4 扩充的 SELECT 命令语句 348页
第 13 章 Web 知识发现 350页
13.1 概述 350页
13.2 Web 知识发现的任务 352页
13.2.1 Web 知识发现任务的分类 352页
13.2.2 Web 内容发现 353页
13.2.3 Web 结构挖掘 354页
13.3 Web 知识发现方法 354页
13.3.1 文本的特征表示 355页
13.3.2 TFIDF 向量表示法 356页
13.3.3 特征子集的选取 358页
13.4 模型质量评价 359页
13.5 文本分析功能 360页
13.5.1 名字提取 362页
13.5.2 术语提取 362页
13.5.3 缩写词识别器 362页
13.5.4 其他提取器 363页
13.6 文本特征的提取 363页
13.6.1 一般特征项的提取 363页
13.6.2 专有特征项的提取 364页
13.7 基于文本挖掘的汉语词性自动标注研究 367页
13.8 文本分类 368页
13.9 文本聚类 372页
13.9.1 层次凝聚法 372页
13.9.2 平面划分法 373页
13.9.3 简单贝叶斯聚类算法 374页
13.9.4 k-最近邻参照聚类算法 375页
13.9.5 分级聚类 375页
13.9.6 基于概念的文本聚类 376页
13.10 文本摘要 377页
13.11 用户兴趣挖掘 378页
第 14 章 生物信息知识发现 380页
14.1 概述 380页
14.2 基因的基本结构 382页
14.3 生物信息数据库与查询 383页
14.3.1 基因和基因组数据库 383页
14.3.2 蛋白质数据库 385页
14.3.3 功能数据库 386页
14.4 序列比对 387页
14.4.1 序列两两比对 387页
14.4.2 多序列比对 389页
14.5 核酸与蛋白质结构和功能的预测分析 390页
14.5.1 核酸序列的预测方法 390页
14.5.2 针对蛋白质的预测方法 391页
14.6 基因组序列信息分析 393页
14.7 功能基因组相关信息分析 395页
14.7.1 大规模基因表达谱分析 396页
14.7.2 基因组水平蛋白质功能综合预测 397页
14.8 Internet资源和公共数据库 398页
参考文献 403页
索引 414页
第 1 章 绪论 15页
1.1 知识 15页
1.2 知识发现 16页
1.3 知识发现的任务 18页
1.3.1 数据总结 18页
1.3.2 概念描述 19页
1.3.3 分类 19页
1.3.4 聚类 20页
1.3.5 相关性分析 20页
1.3.6 偏差分析 20页
1.3.7 建模 21页
1.4 知识发现的方法 21页
1.4.1 统计方法 21页
1.4.2 机器学习 23页
1.4.3 神经计算 25页
1.4.4 可视化 26页
1.5 知识发现的对象 27页
1.5.1 数据库 27页
1.5.2 文本 28页
1.5.3 Web 信息 29页
1.5.4 空间数据 29页
1.5.5 图像和视频数据 30页
1.6 知识发现与创新 31页
第 2 章 决策树 35页
2.1 归纳学习 35页
2.2 决策树学习 35页
2.3 CLS 学习算法 37页
2.4 ID3 学习算法 38页
2.4.1 信息论简介 38页
2.4.2 信息论在决策树学习中的意义及应用 39页
2.4.3 ID3 算法 40页
2.4.4 ID3 算法应用举例 40页
2.5 决策树的改进算法 42页
2.5.1 二叉树判定算法 42页
2.5.2 按信息比值进行估计的方法 43页
2.5.3 按分类信息估值 43页
2.5.4 按划分距离估值的方法 44页
2.6 决策树的评价 45页
2.7 简化决策树 46页
2.7.1 简化决策树的动机 47页
2.7.2 决策树过大的原因 47页
2.7.3 控制树的大小 48页
2.7.4 修改测试属性空间 50页
2.7.5 改进测试属性选择方法 52页
2.7.6 对数据进行限制 54页
2.7.7 改变数据结构 55页
2.8 连续型属性离散化 58页
2.9 基于偏置变换的决策树学习算法 BSDT 59页
2.9.1 偏置的形式化 60页
2.9.2 表示偏置变换 61页
2.9.3 算法描述 62页
2.9.4 过程偏置变换 63页
2.9.5 基于偏置变换的决策树学习算法 BSDT 65页
2.9.6 经典范例库维护算法 TCBM 65页
2.9.7 偏置特征抽取算法 66页
2.9.8 改进的决策树生成算法 GSD 67页
2.9.9 实验结果 69页
2.10 归纳学习中的问题 70页
第 3 章 关联规则 71页
3.1 关联规则挖掘概述 71页
3.1.1 关联规则的意义和度量 71页
3.1.2 经典的挖掘算法 73页
3.2 广义模糊关联规则的挖掘 75页
3.3 挖掘关联规则的数组方法 78页
3.4 任意多表间关联规则的并行挖掘 79页
3.4.1 问题的形式描述 79页
3.4.2 单表内大项集的并行计算 80页
3.4.3 任意多表间大项集的生成 81页
3.4.4 跨表间关联规则的提取 82页
3.5 基于分布式系统的关联规则挖掘算法 82页
3.5.1 候选集的生成 84页
3.5.2 候选数据集的局部剪枝 85页
3.5.3 候选数据集的全局剪枝 87页
3.5.4 合计数轮流检测 89页
3.5.5 分布式挖掘关联规则的算法 90页
3.6 词性标注规则的挖掘算法与应用 92页
3.6.1 汉语词性标注 92页
3.6.2 问题的描述 93页
3.6.3 挖掘算法 94页
3.6.4 试验结果 97页
第 4 章 基于范例的推理 99页
4.1 概述 99页
4.2 过程模型 100页
4.3 范例的表示 102页
4.3.1 语义记忆单元 103页
4.3.2 记忆网 103页
4.4 范例的索引 105页
4.5 范例的检索 106页
4.6 相似性关系 107页
4.6.1 语义相似性 108页
4.6.2 结构相似性 108页
4.6.3 目标特征 108页
4.6.4 个体相似性 109页
4.6.5 相似性计算 109页
4.7 范例的复用 110页
4.8 范例的保存 112页
4.9 基于例示的学习 113页
4.9.1 基于例示学习的任务 113页
4.9.2 IB1 算法 114页
4.9.3 降低存储要求 116页
4.10 范例工程 118页
4.11 范例约简算法 120页
4.12 中心渔场预报专家系统 123页
4.12.1 问题分析与范例表示 123页
4.12.2 相似性度量 125页
4.12.3 索引与检索 125页
4.12.4 基于框架的修正 126页
4.12.5 实验结果 128页
第 5 章 模糊聚类 130页
5.1 概述 130页
5.1.1 聚类结果的表示 130页
5.1.2 模糊聚类的一般模型 130页
5.2 传递闭包法 131页
5.2.1 模糊相似系数的标定 131页
5.2.2 传递闭包法 134页
5.2.3 动态直接聚类法 134页
5.2.4 最大树法 135页
5.3 FCMBP 聚类法 136页
5.3.1 问题背景 136页
5.3.2 Fuzzy等价标准型 138页
5.3.3 置换等价类与平移等价类的记数公式 142页
5.3.4 Xn的结构 143页
5.3.5 模糊最优等价阵的存在性 144页
5.3.6 最优模糊等价阵的算法步骤 145页
5.3.7 基于 FCMBP 模糊聚类的语音识别 149页
5.4 系统聚类法 150页
5.5 C-均值聚类法 152页
5.6 聚类有效性 154页
5.7 聚类方法的比较 155页
第 6 章 粗糙集 157页
6.1 概述 157页
6.1.1 知识的分类观点 159页
6.1.2 新型的隶属关系 159页
6.1.3 概念的边界观点 160页
6.2 知识的约简 161页
6.2.1 一般约简 161页
6.2.2 相对约简 161页
6.2.3 知识的依赖性 162页
6.3 决策逻辑 163页
6.3.1 决策表的公式化定义 163页
6.3.2 决策逻辑语言 164页
6.3.3 决策逻辑语言的语义 165页
6.3.4 决策逻辑的推演 166页
6.3.5 规范表达形式 167页
6.3.6 决策规则和决策算法 167页
6.3.7 决策规则中的一致性和不分明性 168页
6.4 决策表的约简 168页
6.4.1 属性的依赖性 169页
6.4.2 一致决策表的约简 169页
6.4.3 非一致决策表的约简 174页
6.5 粗糙集的扩展模型 177页
6.5.1 可变精度粗糙集模型 178页
6.5.2 相似模型 179页
6.5.3 基于粗糙集的非单调逻辑 179页
6.5.4 与其他数学工具的结合 180页
6.6 粗糙集的实验系统 180页
6.7 粗糙集的展望 182页
第 7 章 贝叶斯网络 183页
7.1 概述 183页
7.1.1 贝叶斯网络的发展历史 183页
7.1.2 贝叶斯方法的基本观点 184页
7.1.3 贝叶斯网络在数据挖掘中的应用 184页
7.2 贝叶斯概率基础 186页
7.2.1 概率论基础 186页
7.2.2 贝叶斯概率 188页
7.3 贝叶斯学习理论 190页
7.3.1 几种常用的先验分布选取方法 191页
7.3.2 计算学习机制 193页
7.3.3 贝叶斯问题求解 195页
7.4 简单贝叶斯学习模型 197页
7.4.1 简单贝叶斯学习模型 197页
7.4.2 简单贝叶斯模型的提升 199页
7.4.3 提升简单贝叶斯分类的计算复杂性 201页
7.5 贝叶斯网络的建造 201页
7.5.1 贝叶斯网络的结构及建立方法 201页
7.5.2 学习贝叶斯网络的概率分布 202页
7.5.3 学习贝叶斯网络的网络结构 204页
7.6 贝叶斯潜在语义模型 207页
7.7 半监督文本挖掘算法 211页
7.7.1 网页聚类 211页
7.7.2 对含有潜在类别主题词的文档的类别标注 211页
7.7.3 基于简单贝叶斯模型学习标注和未标注样本 212页
第 8 章 支持向量机 218页
8.1 统计学习问题 218页
8.1.1 经验风险 218页
8.1.2 VC 维 218页
8.2 学习过程的一致性 219页
8.2.1 学习一致性的经典定义 219页
8.2.2 学习理论的重要定理 219页
8.2.3 VC 熵 220页
8.3 结构风险最小归纳原理 221页
8.4 支持向量机 223页
8.4.1 线性可分 223页
8.4.2 线性不可分 224页
8.5 核函数 226页
8.5.1 多项式核函数 226页
8.5.2 径向基函数 226页
8.5.3 多层感知机 226页
8.5.4 动态核函数 227页
8.6 基于分类超曲面的海量数据分类方法 228页
8.6.1 Jordan 曲线定理 228页
8.6.2 SVM 直接方法基本思想 229页
8.6.3 实现算法 230页
8.6.4 实验结果分析 230页
第 9 章 隐马尔科夫模型 234页
9.1 马尔科夫过程 234页
9.2 隐马尔科夫模型 235页
9.3 似然概率和前反向算法 236页
9.3.1 前向算法 237页
9.3.2 反向算法 237页
9.3.3 Viterbi算法 238页
9.3.4 计算期望 238页
9.4 学习算法 239页
9.4.1 EM 算法 239页
9.4.2 梯度下降 240页
9.4.3 Viterbi学习 241页
9.5 基于状态驻留时间的分段概率模型 241页
9.5.1 SDSPM 模型的构成 242页
第 10 章 神经网络 245页
10.1 概述 245页
10.1.1 基本的神经网络模型 245页
10.1.2 神经网络的学习方法 245页
10.2 人工神经元及感知机模型 247页
10.2.1 基本神经元 247页
10.2.2 感知机模型 248页
10.3 前向神经网络 249页
10.3.1 前向神经网络模型 249页
10.3.2 多层前向神经网络的误差反向传播(BP)算法 250页
10.3.3 BP 算法的若干改进 252页
10.4 径向基函数神经网络 256页
10.4.1 插值问题 257页
10.4.2 正规化问题 257页
10.4.3 RBF 网络学习方法 259页
10.5 反馈神经网络 262页
10.5.1 离散 Hopfield 网络 262页
10.5.2 连续 Hopfield 网络 269页
10.5.3 Hopfield网络应用 270页
10.5.4 双向联想记忆模型 271页
10.6 随机神经网络 272页
10.6.1 模拟退火算法 272页
10.6.2 玻尔兹曼机 275页
10.7 自组织特征映射神经网络 278页
10.7.1 网络的拓扑结构 278页
10.7.2 网络自组织算法 278页
10.7.3 有教师学习 279页
第 11 章 进化和遗传算法 281页
11.1 概述 281页
11.2 基本遗传算法 283页
11.2.1 基本遗传算法的构成要素 283页
11.2.2 基本遗传算法的一般框架 284页
11.3 遗传算法的数学理论 286页
11.3.1 模式定理 287页
11.3.2 积木块假设 289页
11.3.3 遗传算法欺骗问题 290页
11.3.4 隐并行性 290页
11.4 遗传算法的基本实现技术 291页
11.4.1 编码方法 291页
11.4.2 适应度函数 294页
11.4.3 选择算子 296页
11.4.4 交叉算子 298页
11.4.5 变异算子 300页
11.4.6 约束条件的处理方法 301页
11.5 遗传算法的高级实现技术 301页
11.5.1 反转操作 301页
11.5.2 变长度染色体遗传算法 302页
11.5.3 小生境遗传算法 302页
11.5.4 混合遗传算法 303页
11.5.5 改进遗传算法 306页
11.6 并行遗传算法 307页
11.7 遗传算法应用 308页
11.7.1 优化神经网络连接权值 309页
11.7.2 用遗传算法优化神经网络连接结构 309页
第 12 章 知识发现平台 M SM iner 311页
12.1 概述 311页
12.2 数据仓库 313页
12.2.1 数据仓库含义 313页
12.2.2 元数据 314页
12.2.3 OLAP 315页
12.2.4 数据仓库和数据挖掘技术的结合 315页
12.3 MSMiner的体系结构 316页
12.3.1 数据挖掘模型 316页
12.3.2 系统功能 317页
12.3.3 体系结构 318页
12.4 元数据管理 319页
12.4.1 MSMiner元数据的内容 319页
12.4.2 MSMiner元数据库 320页
12.4.3 MSMiner元数据对象模型 320页
12.5 数据仓库管理器 323页
12.5.1 MSMiner数据仓库的基本结构 324页
12.5.2 主题 325页
12.5.3 数据抽取和集成 326页
12.5.4 数据抽取和集成的元数据 329页
12.5.5 数据仓库建模及 OLAP 的实现 330页
12.6 算法库管理 334页
12.6.1 数据挖掘算法的元数据 334页
12.6.2 可扩展性的实现 335页
12.6.3 挖掘算法的接口规范 336页
12.7 数据挖掘任务规划 338页
12.7.1 面向对象的数据挖掘任务模型 338页
12.7.2 数据挖掘任务模型的处理 342页
12.8 关系数据库知识发现查询语言 KDSQL 344页
12.8.1 知识对象 344页
12.8.2 知识发现查询语言定义 345页
12.8.3 扩充的 CREATE 命令语句 346页
12.8.4 扩充的 SELECT 命令语句 348页
第 13 章 Web 知识发现 350页
13.1 概述 350页
13.2 Web 知识发现的任务 352页
13.2.1 Web 知识发现任务的分类 352页
13.2.2 Web 内容发现 353页
13.2.3 Web 结构挖掘 354页
13.3 Web 知识发现方法 354页
13.3.1 文本的特征表示 355页
13.3.2 TFIDF 向量表示法 356页
13.3.3 特征子集的选取 358页
13.4 模型质量评价 359页
13.5 文本分析功能 360页
13.5.1 名字提取 362页
13.5.2 术语提取 362页
13.5.3 缩写词识别器 362页
13.5.4 其他提取器 363页
13.6 文本特征的提取 363页
13.6.1 一般特征项的提取 363页
13.6.2 专有特征项的提取 364页
13.7 基于文本挖掘的汉语词性自动标注研究 367页
13.8 文本分类 368页
13.9 文本聚类 372页
13.9.1 层次凝聚法 372页
13.9.2 平面划分法 373页
13.9.3 简单贝叶斯聚类算法 374页
13.9.4 k-最近邻参照聚类算法 375页
13.9.5 分级聚类 375页
13.9.6 基于概念的文本聚类 376页
13.10 文本摘要 377页
13.11 用户兴趣挖掘 378页
第 14 章 生物信息知识发现 380页
14.1 概述 380页
14.2 基因的基本结构 382页
14.3 生物信息数据库与查询 383页
14.3.1 基因和基因组数据库 383页
14.3.2 蛋白质数据库 385页
14.3.3 功能数据库 386页
14.4 序列比对 387页
14.4.1 序列两两比对 387页
14.4.2 多序列比对 389页
14.5 核酸与蛋白质结构和功能的预测分析 390页
14.5.1 核酸序列的预测方法 390页
14.5.2 针对蛋白质的预测方法 391页
14.6 基因组序列信息分析 393页
14.7 功能基因组相关信息分析 395页
14.7.1 大规模基因表达谱分析 396页
14.7.2 基因组水平蛋白质功能综合预测 397页
14.8 Internet资源和公共数据库 398页
参考文献 403页
索引 414页
知识发现
- 名称
- 类型
- 大小
光盘服务联系方式: 020-38250260 客服QQ:4006604884
云图客服:
用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问
Video Player
×
Audio Player
×
pdf Player
×