计算机视觉教程(第2版)

副标题:无

作   者:章毓晋

分类号:

ISBN:9787115441546

微信扫一扫,移动浏览光盘

简介


本书系统地介绍了计算机视觉的基本原理、典型方法和实用技术,内容包括图像采集、图像预处理、基元检测、目标分割、目标表达和描述、纹理特性分析、形状特性分析、立体视觉、三维景物恢复、运动特性分析、景物识别、广义匹配、时空行为了解、场景解释及计算机视觉系统。读者可从中了解计算机视觉的基本原理和典型技术,并能据此解决计算机视觉应用中的一些具体问题。本书提供了许多讲解例题,每章均有要点小结、参考文献介绍和练习题(为部分练习题提供了解答)。本书可作为信息科学、计算机科学、计算机应用、信号与信息处理、通信与信息系统、电子与通信工程、模式识别与智能系统等学科大学本科或研究生的专业基础课教材,也可作为远程教育或继续教育中计算机应用、电子技术等专业的研究生课程教材,还可供涉及计算机视觉技术应用行业(如工业自动化、人机交互、办公自动化、视觉导航和机器人、安全监控、生物医学、遥感测绘、智能交通和军事公安等)的科技工作者自学及科研参考。
【目录】


1、 绪论 1

 1.1 计算机视觉 1

 1.1.1 视觉概述 1

 1.1.2 计算机视觉的目标 2

 1.1.3 相关学科 2

 1.1.4 应用领域 4

 1.2 图像基础 4

 1.2.1 图像及类别 4

 1.2.2 图像表达和显示 6

 1.2.3 图像存储 7

 1.3 像素间联系 10

 1.3.1 像素邻域 10

 1.3.2 像素间距离 11

 1.4 本书内容提要 14

 1.4.1 计算机视觉系统及模块 14

 1.4.2 如何学习使用本书 15

 总结和复习 17



2、 图像采集 19

 2.1 采集装置 19

 2.2 采集模型 20

 2.2.1 几何成像模型 21

 2.2.2 亮度成像模型 26

 2.2.3 空间和幅度分辨率 28

 2.3 采集方式 29

 2.3.1 成像方式一览 29

 2.3.2 结构光法 30

 2.4 摄像机标定 32

 2.4.1 标定程序和步骤 32

 2.4.2 两级标定法 34

 总结和复习 37



3、 图像预处理 39

 3.1 坐标变换 39

 3.1.1 基本坐标变换 39

 3.1.2 几何失真校正 41

 3.2 灰度映射 43

 3.2.1 灰度映射原理 43

 3.2.2 灰度映射示例 43

 3.3 直方图修正 45

 3.3.1 直方图均衡化 45

 3.3.2 直方图规定化 47

 3.4 空域滤波 50

 3.4.1 原理和分类 50

 3.4.2 线性平滑滤波 51

 3.4.3 线性锐化滤波 53

 3.4.4 非线性平滑滤波 53

 3.4.5 非线性锐化滤波 56

 总结和复习 57



4、 基元检测 59

 4.1 边缘检测 59

 4.1.1 检测原理 59

 4.1.2 一阶导数算子 60

 4.1.3 二阶导数算子 64

 4.1.4 边界闭合 68

 4.1.5 边界细化 68

 4.2 SUSAN算子 69

 4.2.1 USAN原理 69

 4.2.2 角点和边缘检测 70

 4.3 哈里斯兴趣点算子 73

 4.4 哈夫变换 75

 4.3.1 基本哈夫变换 75

 4.3.2 广义哈夫变换 78

 4.3.3 完整广义哈夫变换 80

 4.5 椭圆定位和检测 81

 4.6 位置直方图技术 83

 总结和复习 85



5、 目标分割 87

 5.1 轮廓搜索 87

 5.1.1 图搜索 87

 5.1.2 动态规划 89

 5.2 主动轮廓模型 90

 5.2.1 主动轮廓 90

 5.2.2 能量函数 91

 5.3 基本阈值技术 93

 5.3.1 原理和分类 93

 5.3.2 全局阈值的选取 94

 5.3.3 局部阈值的选取 96

 5.3.4 动态阈值的选取 99

 5.4 特色阈值方法 99

 5.4.1 多分辨率阈值 99

 5.4.2 过渡区阈值 101

 5.5 特征空间聚类 103

 5.5.1 基本聚类方法 103

 5.5.2 均移确定聚类中心 104

 总结和复习 105



6、 目标表达和描述 107

 6.1 基于边界的表达 107

 6.1.1 链码 107

 6.1.2 边界段和凸包 109

 6.1.3 边界标记 110

 6.2 基于区域的表达 112

 6.2.1 四叉树 112

 6.2.2 围绕区域 113

 6.2.3 骨架 113

 6.3 基于边界的描述 115

 6.3.1 边界长度和直径 115

 6.3.2 边界形状数 116

 6.3.3 轮廓形状矩阵 117

 6.4 基于区域的描述 118

 6.4.1 区域面积和密度 118

 6.4.2 区域形状数 119

 6.4.3 区域不变矩 120

 6.4.4 拓扑描述符 122

 总结和复习 123



7、 纹理分析 125

 7.1 统计描述方法 125

 7.1.1 灰度共生矩阵 125

 7.1.2 基于共生矩阵的描述 127

 7.1.3 基于能量的描述 127

 7.2 结构描述方法 129

 7.2.1 结构描述原理 129

 7.2.2 纹理镶嵌 131

 7.2.3 局部二值模式 131

 7.3 频谱描述方法 133

 7.3.1 傅里叶频谱描述 133

 7.3.2 盖伯频谱描述 135

 7.4 纹理图像分割 136

 7.4.1 有监督纹理分割 137

 7.4.2 无监督纹理分割 139

 总结和复习 141



8、 形状分析 143

 8.1 形状紧凑性描述符 143

 8.2 形状复杂性描述符 149

 8.3 基于多边形的形状分析 151

 8.3.1 多边形计算 151

 8.3.2 多边形描述 152

 8.4 基于曲率的形状分析 154

 8.4.1 轮廓曲率 154

 8.4.2 曲面曲率 157

 总结和复习 158



9、 立体视觉 160

 9.1 立体视觉模块 160

 9.2 双目成像和视差 162

 9.2.1 双目横向模式 162

 9.2.2 双目横向会聚模式 164

 9.2.3 双目纵向模式 165

 9.3 基于区域的立体匹配 166

 9.3.1 模板匹配 166

 9.3.2 双目立体匹配 167

 9.4 基于特征的立体匹配 173

 9.4.1 点对点的方法 173

 9.4.2 动态规划匹配 175

 总结和复习 176



10、三维景物恢复 179

 10.1 由光移恢复表面朝向 179

 10.1.1 表面反射特性 179

 10.1.2 目标表面朝向 182

 10.1.3 反射图 183

 10.1.4 光度立体学求解 184

 10.2 从影调获取形状信息 186

 10.2.1 影调与形状 186

 10.2.2 求解亮度方程 188

 10.3 纹理变化与表面朝向 190

 10.3.1 三种典型变化 190

 10.3.2 确定线段的纹理消失点 192

 10.4 根据焦距确定深度 195

 总结和复习 196



11、运动分析 198

 11.1 运动分类和表达 198

 11.2 全局运动检测 201

 11.2.1 利用图像差的检测 202

 11.2.2 基于模型的检测 204

 11.3 运动目标检测和分割 206

 11.3.1 背景建模 206

 11.3.2 运动目标跟踪 209

 11.3.3 运动目标分割 213

 11.4 运动光流和表面取向 214

 11.4.1 光流约束方程 214

 11.4.2 光流计算 214

 11.4.3 光流与表面取向 218

 总结和复习 221



12、景物识别 223

 12.1 统计模式分类 223

 12.1.1 模式分类原理 223

 12.1.2 最小距离分类器 224

 12.1.3 最优统计分类器 225

 12.2 感知机 228

 12.3 支持向量机 231

 12.4 结构模式识别 234

 12.4.1 字符串结构识别 234

 12.4.2 树结构识别 237

 总结和复习 239



13、广义匹配 241

 13.1 目标匹配 241

 13.1.1 匹配的度量 241

 13.1.2 字符串匹配 244

 13.1.3 惯量等效椭圆匹配 245

 13.2 动态模式匹配 247

 13.3 关系匹配 249

 13.3.1 关系表达和距离 249

 13.3.2 关系匹配模型 251

 13.4 图同构匹配 252

 13.4.1 图论基础 252

 13.4.2 图同构和匹配 255

 总结和复习 256



14、时空行为理解 259

 14.1 时空技术 259

 14.2 时空兴趣点 260

 14.3 动态轨迹学习和分析 262

 14.3.1 自动场景建模 263

 14.3.2 路径学习 264

 14.3.3 自动活动分析 266

 14.4 动作分类和识别 267

 14.4.1 动作分类 267

 14.4.2 动作识别 268

 14.5 活动和行为建模 272

 14.5.1 动作建模 272

 14.5.2 活动建模和识别 275

 总结和复习 278



15、场景解释 280

 15.1 线条图标记解释 280

 15.2 体育比赛视频排序 283

 15.3 计算机视觉系统模型 287

 15.3.1 多层次串行结构 287

 15.3.2 知识库为中心的辐射结构 288

 15.3.3 知识库为根的树结构 288

 15.3.4 多模块交叉配合结构 289

 15.4 计算机视觉理论框架 290

 15.4.1 马尔视觉计算理论 290

 15.4.2 对马尔理论框架的改进 293

 15.4.3 新理论框架的研究 294

 总结和复习 296



部分练习题解答 298



参考文献 304



索引 310




目录




1、 绪论 1

 1.1 计算机视觉 1

 1.1.1 视觉概述 1

 1.1.2 计算机视觉的目标 2

 1.1.3 相关学科 2

 1.1.4 应用领域 4

 1.2 图像基础 4

 1.2.1 图像及类别 4

 1.2.2 图像表达和显示 6

 1.2.3 图像存储 7

 1.3 像素间联系 10

 1.3.1 像素邻域 10

 1.3.2 像素间距离 11

 1.4 本书内容提要 14

 1.4.1 计算机视觉系统及模块 14

 1.4.2 如何学习使用本书 15

 总结和复习 17



2、 图像采集 19

 2.1 采集装置 19

 2.2 采集模型 20

 2.2.1 几何成像模型 21

 2.2.2 亮度成像模型 26

 2.2.3 空间和幅度分辨率 28

 2.3 采集方式 29

 2.3.1 成像方式一览 29

 2.3.2 结构光法 30

 2.4 摄像机标定 32

 2.4.1 标定程序和步骤 32

 2.4.2 两级标定法 34

 总结和复习 37



3、 图像预处理 39

 3.1 坐标变换 39

 3.1.1 基本坐标变换 39

 3.1.2 几何失真校正 41

 3.2 灰度映射 43

 3.2.1 灰度映射原理 43

 3.2.2 灰度映射示例 43

 3.3 直方图修正 45

 3.3.1 直方图均衡化 45

 3.3.2 直方图规定化 47

 3.4 空域滤波 50

 3.4.1 原理和分类 50

 3.4.2 线性平滑滤波 51

 3.4.3 线性锐化滤波 53

 3.4.4 非线性平滑滤波 53

 3.4.5 非线性锐化滤波 56

 总结和复习 57



4、 基元检测 59

 4.1 边缘检测 59

 4.1.1 检测原理 59

 4.1.2 一阶导数算子 60

 4.1.3 二阶导数算子 64

 4.1.4 边界闭合 68

 4.1.5 边界细化 68

 4.2 SUSAN算子 69

 4.2.1 USAN原理 69

 4.2.2 角点和边缘检测 70

 4.3 哈里斯兴趣点算子 73

 4.4 哈夫变换 75

 4.3.1 基本哈夫变换 75

 4.3.2 广义哈夫变换 78

 4.3.3 完整广义哈夫变换 80

 4.5 椭圆定位和检测 81

 4.6 位置直方图技术 83

 总结和复习 85



5、 目标分割 87

 5.1 轮廓搜索 87

 5.1.1 图搜索 87

 5.1.2 动态规划 89

 5.2 主动轮廓模型 90

 5.2.1 主动轮廓 90

 5.2.2 能量函数 91

 5.3 基本阈值技术 93

 5.3.1 原理和分类 93

 5.3.2 全局阈值的选取 94

 5.3.3 局部阈值的选取 96

 5.3.4 动态阈值的选取 99

 5.4 特色阈值方法 99

 5.4.1 多分辨率阈值 99

 5.4.2 过渡区阈值 101

 5.5 特征空间聚类 103

 5.5.1 基本聚类方法 103

 5.5.2 均移确定聚类中心 104

 总结和复习 105



6、 目标表达和描述 107

 6.1 基于边界的表达 107

 6.1.1 链码 107

 6.1.2 边界段和凸包 109

 6.1.3 边界标记 110

 6.2 基于区域的表达 112

 6.2.1 四叉树 112

 6.2.2 围绕区域 113

 6.2.3 骨架 113

 6.3 基于边界的描述 115

 6.3.1 边界长度和直径 115

 6.3.2 边界形状数 116

 6.3.3 轮廓形状矩阵 117

 6.4 基于区域的描述 118

 6.4.1 区域面积和密度 118

 6.4.2 区域形状数 119

 6.4.3 区域不变矩 120

 6.4.4 拓扑描述符 122

 总结和复习 123



7、 纹理分析 125

 7.1 统计描述方法 125

 7.1.1 灰度共生矩阵 125

 7.1.2 基于共生矩阵的描述 127

 7.1.3 基于能量的描述 127

 7.2 结构描述方法 129

 7.2.1 结构描述原理 129

 7.2.2 纹理镶嵌 131

 7.2.3 局部二值模式 131

 7.3 频谱描述方法 133

 7.3.1 傅里叶频谱描述 133

 7.3.2 盖伯频谱描述 135

 7.4 纹理图像分割 136

 7.4.1 有监督纹理分割 137

 7.4.2 无监督纹理分割 139

 总结和复习 141



8、 形状分析 143

 8.1 形状紧凑性描述符 143

 8.2 形状复杂性描述符 149

 8.3 基于多边形的形状分析 151

 8.3.1 多边形计算 151

 8.3.2 多边形描述 152

 8.4 基于曲率的形状分析 154

 8.4.1 轮廓曲率 154

 8.4.2 曲面曲率 157

 总结和复习 158



9、 立体视觉 160

 9.1 立体视觉模块 160

 9.2 双目成像和视差 162

 9.2.1 双目横向模式 162

 9.2.2 双目横向会聚模式 164

 9.2.3 双目纵向模式 165

 9.3 基于区域的立体匹配 166

 9.3.1 模板匹配 166

 9.3.2 双目立体匹配 167

 9.4 基于特征的立体匹配 173

 9.4.1 点对点的方法 173

 9.4.2 动态规划匹配 175

 总结和复习 176



10、三维景物恢复 179

 10.1 由光移恢复表面朝向 179

 10.1.1 表面反射特性 179

 10.1.2 目标表面朝向 182

 10.1.3 反射图 183

 10.1.4 光度立体学求解 184

 10.2 从影调获取形状信息 186

 10.2.1 影调与形状 186

 10.2.2 求解亮度方程 188

 10.3 纹理变化与表面朝向 190

 10.3.1 三种典型变化 190

 10.3.2 确定线段的纹理消失点 192

 10.4 根据焦距确定深度 195

 总结和复习 196



11、运动分析 198

 11.1 运动分类和表达 198

 11.2 全局运动检测 201

 11.2.1 利用图像差的检测 202

 11.2.2 基于模型的检测 204

 11.3 运动目标检测和分割 206

 11.3.1 背景建模 206

 11.3.2 运动目标跟踪 209

 11.3.3 运动目标分割 213

 11.4 运动光流和表面取向 214

 11.4.1 光流约束方程 214

 11.4.2 光流计算 214

 11.4.3 光流与表面取向 218

 总结和复习 221



12、景物识别 223

 12.1 统计模式分类 223

 12.1.1 模式分类原理 223

 12.1.2 最小距离分类器 224

 12.1.3 最优统计分类器 225

 12.2 感知机 228

 12.3 支持向量机 231

 12.4 结构模式识别 234

 12.4.1 字符串结构识别 234

 12.4.2 树结构识别 237

 总结和复习 239



13、广义匹配 241

 13.1 目标匹配 241

 13.1.1 匹配的度量 241

 13.1.2 字符串匹配 244

 13.1.3 惯量等效椭圆匹配 245

 13.2 动态模式匹配 247

 13.3 关系匹配 249

 13.3.1 关系表达和距离 249

 13.3.2 关系匹配模型 251

 13.4 图同构匹配 252

 13.4.1 图论基础 252

 13.4.2 图同构和匹配 255

 总结和复习 256



14、时空行为理解 259

 14.1 时空技术 259

 14.2 时空兴趣点 260

 14.3 动态轨迹学习和分析 262

 14.3.1 自动场景建模 263

 14.3.2 路径学习 264

 14.3.3 自动活动分析 266

 14.4 动作分类和识别 267

 14.4.1 动作分类 267

 14.4.2 动作识别 268

 14.5 活动和行为建模 272

 14.5.1 动作建模 272

 14.5.2 活动建模和识别 275

 总结和复习 278



15、场景解释 280

 15.1 线条图标记解释 280

 15.2 体育比赛视频排序 283

 15.3 计算机视觉系统模型 287

 15.3.1 多层次串行结构 287

 15.3.2 知识库为中心的辐射结构 288

 15.3.3 知识库为根的树结构 288

 15.3.4 多模块交叉配合结构 289

 15.4 计算机视觉理论框架 290

 15.4.1 马尔视觉计算理论 290

 15.4.2 对马尔理论框架的改进 293

 15.4.3 新理论框架的研究 294

 总结和复习 296



部分练习题解答 298



参考文献 304



索引 310




【作者简介】
章毓晋已承担和完成了多项国家自然科学基金、国家高技术计划及国家教委博士点基金等资助的研究项目,并在国内外发表了300余篇图像工程研究论文,出版了专著《图象分割》和《基于内容的视觉信息检索》,主编出版了"Advances in Image and Video Segmentation"和"Semantic-Based Visual Information Retrieval" 。

已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

计算机视觉教程(第2版)
    • 名称
    • 类型
    • 大小

    光盘服务联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    loading icon