微信扫一扫,移动浏览光盘
简介
《流计算和视频编码》由张春元、文梅、苏华友、伍楠、任巨所著,结合课题研究,比较全面地反映了我们在流计算领域,包括流计算原理、视频编码应用、流化方法、基于单指令多数据和GPU的流化实现等方面取得的研究成果,可供并行处理器体系结构、并行编程、视频编码等方向的研究人员参考,也可作为计算机科学与技术等专业高年级本科生和研究生的教材。
目录
前言
第1章 视频压缩编码
1.1 概述
1.2 视频压缩编码面临的新挑战
1.3 视频编码并行化潜力
1.4 H.264编码标准
1.4.1 基本概况
1.4.2 编码器结构
1.4.3 特点和关键技术
1.4.4 帧间预测
1.4.5 帧内预测
1.4.6 变换量化
1.4.7 熵编码
1.4.8 去块滤波
第2章 流计算原理
2.1 流计算思想
2.2 流体系结构模型
2.2.1 解耦合计算和访存
2.2.2 多级存储层次
2.2.3 典型流处理器
2.3 流程序设计模型
2.3.1 流级程序
2.3.2 核心级程序
2.3.3 流计算模型与并行处理器的结合
2.4 流应用
第3章 流化方法
3.1 流化
3.1.1 流化定义
3.1.2 流化特征
3.1.3 特征指标有效性验证
3.2 基本流化方法
3.2.1 循环划分法
3.2.2 核心合并技术
3.2.3 流分割技术
3.2.4 常规流化步骤
3.3 高级流化方法
3.3.1 流重组
3.3.2 短流加载
3.3.3 核心分裂
3.3.4 并行粒度调整
3.4 面向流化的程序结构优化
3.4.1 重负载循环
3.4.2 计算窗口重叠
3.4.3 循环内分支
3.4.4 循环间数据相关
第4章 H.264编码器的流化
4.1 x264编码器概述
4.2 x264编码器结构剖析
4.2.1 profile工具:PAPI
4.2.2 函数层次的局限性
4.2.3 变量和数据结构层次的局限性
4.2.4 控制密集型组件层次的局限性
4.3 x264编码程序的流化
4.3.1 函数到Kernel的转化
4.3.2 结构变量到stream的转化
4.3.3 控制密集型组件到计算密集型组件的转化
4.4 S264:流化的H-264框架
第5章 S264/S:基于SIMD并行的H.264流化编码器
5.1 SIMD流处理器
5.2 帧间预测的流式实现
5.2.1 全搜索:流重用
5.2.2 UMHexagonS:非规则流
5.2.3 多分辨率多窗口帧间预测
5.2.4 分析与讨论
5.3 帧内编码:多模式和强数据相关
5.3.1 相关性分析
5.3.2 相关性问题:可扩展块并行
5.3.3 多模式问题:Kernel参数化
5.3.4 分析与讨论
5.4 CAVLC的流式实现:可变长编码
5.4.1 相关性分析
5.4.2 解耦合分段并行
5.4.3 分析与讨论
5.5 去块滤波的流式实现:控制密集型
5.5.1 相关性分析
5.5.2 去块滤波的流式实现:分组并行
5.5.3 分析与讨论
5.6 基于STORM的SIMD H.264编码器
5.6.1 S264./S编码器
5.6.2 评测与分析
第6章 S264/G:基于GPU的并行H.264编码器
6.1 GPU和CUDA
6.1.1 GPU概述
6.1.2 CUDA硬件模型
6.1.3 CUDA编程模型
6.1.4 CUDA存储模型
6.2 基于CUDA的H.264编码器框架
6.3 帧间预测:平衡线程数与并行粒度
6.3.1 SAD计算
6.3.2 最佳运动向量的选择
6.3.3 小结
6.4 帧内编码:开发多级并行
6.4.1 开发多级并行
6.4.2 存储模型
6.4.3 优化
6.4.4 小结
6.5 分量优先的CAVLC
6.5.1 分量优先的CAVLC体系结构
6.5.2 基于CUDA的并行CAVLC实现
6.5.3 小结
6.6 方向优先的去块滤波
6.6.1 方向优先去块滤波结构
6.6.2 滤波顺序的调度
6.6.3 小结
6.7 实验结果与性能分析
6.7.1 并行编码器的性能
6.7.2 编码器特征分析
6.7.3 小结
第7章 展望与未来的研究方向
7.1 视频编码发展趋势
7.1.1 基于内容的视频编码
7.1.2 多视角视频编码
7.1.3 分布式视频编码
7.2 三维视频编码流化并行研究
7.3 面向媒体的并行计算
参考文献
第1章 视频压缩编码
1.1 概述
1.2 视频压缩编码面临的新挑战
1.3 视频编码并行化潜力
1.4 H.264编码标准
1.4.1 基本概况
1.4.2 编码器结构
1.4.3 特点和关键技术
1.4.4 帧间预测
1.4.5 帧内预测
1.4.6 变换量化
1.4.7 熵编码
1.4.8 去块滤波
第2章 流计算原理
2.1 流计算思想
2.2 流体系结构模型
2.2.1 解耦合计算和访存
2.2.2 多级存储层次
2.2.3 典型流处理器
2.3 流程序设计模型
2.3.1 流级程序
2.3.2 核心级程序
2.3.3 流计算模型与并行处理器的结合
2.4 流应用
第3章 流化方法
3.1 流化
3.1.1 流化定义
3.1.2 流化特征
3.1.3 特征指标有效性验证
3.2 基本流化方法
3.2.1 循环划分法
3.2.2 核心合并技术
3.2.3 流分割技术
3.2.4 常规流化步骤
3.3 高级流化方法
3.3.1 流重组
3.3.2 短流加载
3.3.3 核心分裂
3.3.4 并行粒度调整
3.4 面向流化的程序结构优化
3.4.1 重负载循环
3.4.2 计算窗口重叠
3.4.3 循环内分支
3.4.4 循环间数据相关
第4章 H.264编码器的流化
4.1 x264编码器概述
4.2 x264编码器结构剖析
4.2.1 profile工具:PAPI
4.2.2 函数层次的局限性
4.2.3 变量和数据结构层次的局限性
4.2.4 控制密集型组件层次的局限性
4.3 x264编码程序的流化
4.3.1 函数到Kernel的转化
4.3.2 结构变量到stream的转化
4.3.3 控制密集型组件到计算密集型组件的转化
4.4 S264:流化的H-264框架
第5章 S264/S:基于SIMD并行的H.264流化编码器
5.1 SIMD流处理器
5.2 帧间预测的流式实现
5.2.1 全搜索:流重用
5.2.2 UMHexagonS:非规则流
5.2.3 多分辨率多窗口帧间预测
5.2.4 分析与讨论
5.3 帧内编码:多模式和强数据相关
5.3.1 相关性分析
5.3.2 相关性问题:可扩展块并行
5.3.3 多模式问题:Kernel参数化
5.3.4 分析与讨论
5.4 CAVLC的流式实现:可变长编码
5.4.1 相关性分析
5.4.2 解耦合分段并行
5.4.3 分析与讨论
5.5 去块滤波的流式实现:控制密集型
5.5.1 相关性分析
5.5.2 去块滤波的流式实现:分组并行
5.5.3 分析与讨论
5.6 基于STORM的SIMD H.264编码器
5.6.1 S264./S编码器
5.6.2 评测与分析
第6章 S264/G:基于GPU的并行H.264编码器
6.1 GPU和CUDA
6.1.1 GPU概述
6.1.2 CUDA硬件模型
6.1.3 CUDA编程模型
6.1.4 CUDA存储模型
6.2 基于CUDA的H.264编码器框架
6.3 帧间预测:平衡线程数与并行粒度
6.3.1 SAD计算
6.3.2 最佳运动向量的选择
6.3.3 小结
6.4 帧内编码:开发多级并行
6.4.1 开发多级并行
6.4.2 存储模型
6.4.3 优化
6.4.4 小结
6.5 分量优先的CAVLC
6.5.1 分量优先的CAVLC体系结构
6.5.2 基于CUDA的并行CAVLC实现
6.5.3 小结
6.6 方向优先的去块滤波
6.6.1 方向优先去块滤波结构
6.6.2 滤波顺序的调度
6.6.3 小结
6.7 实验结果与性能分析
6.7.1 并行编码器的性能
6.7.2 编码器特征分析
6.7.3 小结
第7章 展望与未来的研究方向
7.1 视频编码发展趋势
7.1.1 基于内容的视频编码
7.1.2 多视角视频编码
7.1.3 分布式视频编码
7.2 三维视频编码流化并行研究
7.3 面向媒体的并行计算
参考文献
著者还有:文敏、苏华友、伍楠、任巨
- 名称
- 类型
- 大小
光盘服务联系方式: 020-38250260 客服QQ:4006604884
云图客服:
用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问
Video Player
×
Audio Player
×
pdf Player
×