微信扫一扫,移动浏览光盘
简介
目录
译者序
前言
致谢
第1章 简介1
1.1 什么是机器学习1
1.1.1 为什么需要使用机器学习2
1.1.2 做出数据驱动决策3
1.1.3 定义以及关键术语4
1.1.4 机器学习的关键任务6
1.1.5 机器学习技术6
1.2 机器学习框架6
1.2.1 数据收集7
1.2.2 数据描述7
1.2.3 探索性数据分析7
1.2.4 数据质量分析8
1.2.5 数据准备8
1.2.6 数据集成8
1.2.7 数据整理8
1.2.8 特征缩放和特征提取9
1.2.9 特征选择及降维9
1.2.10 建模9
1.2.11 选择建模技术9
1.2.12 构建模型10
1.2.13 模型评估及调优10
1.2.14 实现以及检验已经创建的模型10
1.2.15 监督学习框架11
1.2.16 无监督学习框架11
1.3 性能评估12
1.3.1 混淆矩阵13
1.3.2 F值分析14
1.3.3 ROC分析15
1.3.4 Kappa统计量15
1.3.5 度量了什么16
1.3.6 如何度量17
1.3.7 如何解释估计17
1.3.8 scikit-learn中的k折交叉验证18
1.3.9 如何选择正确的算法18
1.4 Python机器学习环境18
1.4.1 缺陷20
1.4.2 缺点20
1.4.3 NumPy库20
1.4.4 Pandas20
1.5 本章小结21
1.6 参考文献22
第2章 数据预处理23
2.1 简介23
2.2 特征提取和转换24
2.2.1 特征类型24
2.2.2 统计特征25
2.2.3 结构化特征27
2.2.4 特征转换28
2.2.5 阈值化和离散化28
2.2.6 数据操作28
2.2.7 标准化29
2.2.8 归一化和校准33
2.2.9 不完整的特征34
2.2.10 特征提取的方法36
2.2.11 使用小波变换进行特征提取38
2.3 降维45
2.3.1 特征构造和选择47
2.3.2 单变量特征选择48
2.3.3 递归式特征消除51
2.3.4 从模型选择特征52
2.3.5 主成分分析53
2.3.6 增量PCA57
2.3.7 核PCA58
2.3.8 邻近成分分析59
2.3.9 独立成分分析61
2.3.10 线性判别分析65
2.3.11 熵67
2.4 基于聚类的特征提取和降维68
2.5 参考文献75
第3章 机器学习技术77
3.1 简介77
3.2 什么是机器学习78
3.2.1 理解机器学习78
3.2.2 如何让机器学习78
3.2.3 多学科领域79
3.2.4 机器学习问题80
3.2.5 机器学习的目标80
3.2.6 机器学习的挑战81
3.3 Python库81
3.3.1 scikit-learn81
3.3.2 TensorFlow83
3.3.3 Keras84
3.3.4 使用Keras构建模型84
3.3.5 自然语言工具包85
3.4 学习场景87
3.5 监督学习算法88
3.5.1 分类89
3.5.2 预报、预测和回归90
3.5.3 线性模型90
3.5.4 感知机98
3.5.5 逻辑回归100
3.5.6 线性判别分析102
3.5.7 人工神经网络105
3.5.8 k近邻109
3.5.9 支持向量机113
3.5.10 决策树分类器118
3.5.11 朴素贝叶斯123
3.5.12 集成学习126
3.5.13 bagging算法127
3.5.14 随机森林131
3.5.15 boosting算法136
3.5.16 其他集成方法146
3.5.17 深度学习151
3.5.18 深度神经网络152
3.5.19 循环神经网络155
3.5.20 自编码器157
3.5.21 长短期记忆网络157
3.5.22 卷积神经网络160
3.6 无监督学习162
3.6.1 k均值算法163
3.6.2 轮廓系数165
3.6.3 异常检测167
3.6.4 关联规则挖掘170
3.7 强化学习170
3.8 基于实例的学习171
3.9 本章小结171
3.10 参考文献172
第4章 医疗保健分类示例174
4.1 简介174
4.2 脑电图信号分析175
4.2.1 癫痫症的预测和检测176
4.2.2 情绪识别194
4.2.3 局灶性和非局灶性癫痫EEG信号的分类201
4.2.4 偏头痛检测212
4.3 EMG信号分析217
4.3.1 神经肌肉疾病的诊断218
4.3.2 假体控制中的EMG信号225
4.3.3 康复机器人中的EMG信号232
4.4 心电图信号分析238
4.5 人类活动识别247
4.5.1 基于传感器的人类活动识别248
4.5.2 基于智能手机的人类活动识别250
4.6 用于癌症检测的微阵列基因表达数据分类256
4.7 乳腺癌检测257
4.8 预测胎儿风险的心电图数据分类260
4.9 糖尿病检测263
4.10 心脏病检测267
4.11 慢性肾脏病的诊断270
4.12 本章小结273
4.13 参考文献273
第5章 其他分类示例277
5.1 入侵检测277
5.2 钓鱼网站检测280
5.3 垃圾邮件检测283
5.4 信用评分287
5.5 信用卡欺诈检测290
5.6 使用CNN进行手写数字识别297
5.7 使用CNN进行Fashion-MNIST图像分类306
5.8 使用CNN进行CIFAR图像分类313
5.9 文本分类321
5.10 本章小结334
5.11 参考文献334
第6章 回归示例337
6.1 简介337
6.2 股票市场价格指数收益预测338
6.3 通货膨胀预测356
6.4 电力负荷预测358
6.5 风速预测365
6.6 旅游需求预测370
6.7 房价预测380
6.8 单车使用情况预测395
6.9 本章小结399
6.10 参考文献400
第7章 聚类示例402
7.1 简介402
7.2 聚类403
7.2.1 评估聚类输出404
7.2.2 聚类分析的应用404
7.2.3 可能的聚类数405
7.2.4 聚类算法种类405
7.3 k均值聚类算法406
7.4 k中心点聚类算法408
7.5 层次聚类409
7.5.1 聚集聚类算法409
7.5.2 分裂聚类算法412
7.6 模糊c均值聚类算法416
7.7 基于密度的聚类算法418
7.7.1 DBSCAN算法418
7.7.2 OPTICS聚类算法420
7.8 基于期望化的混合高斯模型聚类算法423
7.9 贝叶斯聚类426
7.10 轮廓分析428
7.11 基于聚类的图像分割430
7.12 基于聚类的特征提取433
7.13 基于聚类的分类439
7.14 本章小结442
7.15 参考文献442
前言
致谢
第1章 简介1
1.1 什么是机器学习1
1.1.1 为什么需要使用机器学习2
1.1.2 做出数据驱动决策3
1.1.3 定义以及关键术语4
1.1.4 机器学习的关键任务6
1.1.5 机器学习技术6
1.2 机器学习框架6
1.2.1 数据收集7
1.2.2 数据描述7
1.2.3 探索性数据分析7
1.2.4 数据质量分析8
1.2.5 数据准备8
1.2.6 数据集成8
1.2.7 数据整理8
1.2.8 特征缩放和特征提取9
1.2.9 特征选择及降维9
1.2.10 建模9
1.2.11 选择建模技术9
1.2.12 构建模型10
1.2.13 模型评估及调优10
1.2.14 实现以及检验已经创建的模型10
1.2.15 监督学习框架11
1.2.16 无监督学习框架11
1.3 性能评估12
1.3.1 混淆矩阵13
1.3.2 F值分析14
1.3.3 ROC分析15
1.3.4 Kappa统计量15
1.3.5 度量了什么16
1.3.6 如何度量17
1.3.7 如何解释估计17
1.3.8 scikit-learn中的k折交叉验证18
1.3.9 如何选择正确的算法18
1.4 Python机器学习环境18
1.4.1 缺陷20
1.4.2 缺点20
1.4.3 NumPy库20
1.4.4 Pandas20
1.5 本章小结21
1.6 参考文献22
第2章 数据预处理23
2.1 简介23
2.2 特征提取和转换24
2.2.1 特征类型24
2.2.2 统计特征25
2.2.3 结构化特征27
2.2.4 特征转换28
2.2.5 阈值化和离散化28
2.2.6 数据操作28
2.2.7 标准化29
2.2.8 归一化和校准33
2.2.9 不完整的特征34
2.2.10 特征提取的方法36
2.2.11 使用小波变换进行特征提取38
2.3 降维45
2.3.1 特征构造和选择47
2.3.2 单变量特征选择48
2.3.3 递归式特征消除51
2.3.4 从模型选择特征52
2.3.5 主成分分析53
2.3.6 增量PCA57
2.3.7 核PCA58
2.3.8 邻近成分分析59
2.3.9 独立成分分析61
2.3.10 线性判别分析65
2.3.11 熵67
2.4 基于聚类的特征提取和降维68
2.5 参考文献75
第3章 机器学习技术77
3.1 简介77
3.2 什么是机器学习78
3.2.1 理解机器学习78
3.2.2 如何让机器学习78
3.2.3 多学科领域79
3.2.4 机器学习问题80
3.2.5 机器学习的目标80
3.2.6 机器学习的挑战81
3.3 Python库81
3.3.1 scikit-learn81
3.3.2 TensorFlow83
3.3.3 Keras84
3.3.4 使用Keras构建模型84
3.3.5 自然语言工具包85
3.4 学习场景87
3.5 监督学习算法88
3.5.1 分类89
3.5.2 预报、预测和回归90
3.5.3 线性模型90
3.5.4 感知机98
3.5.5 逻辑回归100
3.5.6 线性判别分析102
3.5.7 人工神经网络105
3.5.8 k近邻109
3.5.9 支持向量机113
3.5.10 决策树分类器118
3.5.11 朴素贝叶斯123
3.5.12 集成学习126
3.5.13 bagging算法127
3.5.14 随机森林131
3.5.15 boosting算法136
3.5.16 其他集成方法146
3.5.17 深度学习151
3.5.18 深度神经网络152
3.5.19 循环神经网络155
3.5.20 自编码器157
3.5.21 长短期记忆网络157
3.5.22 卷积神经网络160
3.6 无监督学习162
3.6.1 k均值算法163
3.6.2 轮廓系数165
3.6.3 异常检测167
3.6.4 关联规则挖掘170
3.7 强化学习170
3.8 基于实例的学习171
3.9 本章小结171
3.10 参考文献172
第4章 医疗保健分类示例174
4.1 简介174
4.2 脑电图信号分析175
4.2.1 癫痫症的预测和检测176
4.2.2 情绪识别194
4.2.3 局灶性和非局灶性癫痫EEG信号的分类201
4.2.4 偏头痛检测212
4.3 EMG信号分析217
4.3.1 神经肌肉疾病的诊断218
4.3.2 假体控制中的EMG信号225
4.3.3 康复机器人中的EMG信号232
4.4 心电图信号分析238
4.5 人类活动识别247
4.5.1 基于传感器的人类活动识别248
4.5.2 基于智能手机的人类活动识别250
4.6 用于癌症检测的微阵列基因表达数据分类256
4.7 乳腺癌检测257
4.8 预测胎儿风险的心电图数据分类260
4.9 糖尿病检测263
4.10 心脏病检测267
4.11 慢性肾脏病的诊断270
4.12 本章小结273
4.13 参考文献273
第5章 其他分类示例277
5.1 入侵检测277
5.2 钓鱼网站检测280
5.3 垃圾邮件检测283
5.4 信用评分287
5.5 信用卡欺诈检测290
5.6 使用CNN进行手写数字识别297
5.7 使用CNN进行Fashion-MNIST图像分类306
5.8 使用CNN进行CIFAR图像分类313
5.9 文本分类321
5.10 本章小结334
5.11 参考文献334
第6章 回归示例337
6.1 简介337
6.2 股票市场价格指数收益预测338
6.3 通货膨胀预测356
6.4 电力负荷预测358
6.5 风速预测365
6.6 旅游需求预测370
6.7 房价预测380
6.8 单车使用情况预测395
6.9 本章小结399
6.10 参考文献400
第7章 聚类示例402
7.1 简介402
7.2 聚类403
7.2.1 评估聚类输出404
7.2.2 聚类分析的应用404
7.2.3 可能的聚类数405
7.2.4 聚类算法种类405
7.3 k均值聚类算法406
7.4 k中心点聚类算法408
7.5 层次聚类409
7.5.1 聚集聚类算法409
7.5.2 分裂聚类算法412
7.6 模糊c均值聚类算法416
7.7 基于密度的聚类算法418
7.7.1 DBSCAN算法418
7.7.2 OPTICS聚类算法420
7.8 基于期望化的混合高斯模型聚类算法423
7.9 贝叶斯聚类426
7.10 轮廓分析428
7.11 基于聚类的图像分割430
7.12 基于聚类的特征提取433
7.13 基于聚类的分类439
7.14 本章小结442
7.15 参考文献442
机器学习实践:基于Python进行数据分析
- 名称
- 类型
- 大小
光盘服务联系方式: 020-38250260 客服QQ:4006604884
云图客服:
用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问
Video Player
×
Audio Player
×
pdf Player
×