logo资料库

AVS3-P2 AVS3视频标准文本文档(基准档).pdf

第1页 / 共216页
第2页 / 共216页
第3页 / 共216页
第4页 / 共216页
第5页 / 共216页
第6页 / 共216页
第7页 / 共216页
第8页 / 共216页
资料共216页,剩余部分请下载后查看
目  次
前  言
引  言
AVS3 第2部分:视频
1  范围
2  规范性引用文件
3  术语和定义
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
3.10
3.11
3.12
3.13
3.14
3.15
3.16
3.17
3.18
3.19
3.20
3.21
3.22
3.23
3.24
3.25
3.26
3.27
3.28
3.29
3.30
3.31
3.32
3.33
3.34
3.35
3.36
3.37
3.38
3.39
3.40
3.41
3.42
3.43
3.44
3.45
3.46
3.47
3.48
3.49
3.50
3.51
3.52
3.53
3.54
3.55
3.56
3.57
3.58
3.59
3.60
3.61
3.62
3.63
3.64
3.65
3.66
3.67
3.68
3.69
3.70
3.71
3.72
3.73
3.74
3.75
3.76
3.77
3.78
3.79
3.80
3.81
3.82
3.83
3.84
3.85
3.86
3.87
3.88
3.89
3.90
3.91
3.92
3.93
4  缩略语
5  约定
5.1  概述
5.2  算术运算符
5.3  逻辑运算符
5.4  关系运算符
5.5  位运算符
5.6  赋值
5.7  数学函数
5.8  结构关系符
5.9  位流语法、解析过程和解码过程的描述方法
5.9.1  位流语法的描述方法
5.9.2  函数
5.9.2.1  概述
5.9.2.2  byte_aligned( )
5.9.2.3  next_bits( n )
5.9.2.4  byte_aligned_next_bits( n )
5.9.2.5  next_start_code( )
5.9.2.6  is_end_of_patch( )
5.9.2.7  is_stuffing_pattern( )
5.9.2.8  read_bits( n )
5.9.3  描述符
5.9.4  保留、禁止和标记位
6  编码位流的结构
6.1  视频序列
6.1.1  概述
6.1.2  逐行和隔行视频序列
6.1.3  序列头
6.2  图像
6.2.1  概述
6.2.2  图像格式
6.2.2.1  4:0:0格式
6.2.2.2  4:2:0格式
6.2.2.3  4:2:2格式
6.2.2.4  4:4:4格式
6.2.3  图像类型
6.2.4  图像间的顺序
6.2.5  参考图像和参考图像队列
6.3  片
6.4  最大编码单元、编码树和编码单元
7  位流的语法和语义
7.1  语法描述
7.1.1  起始码
7.1.2  视频序列语法
7.1.2.1  视频序列定义
7.1.2.2  序列头定义
7.1.2.3  参考图像队列配置集定义
7.1.2.4  加权量化数据定义
7.1.2.5  扩展和用户数据语法
7.1.2.6  序列显示扩展定义
7.1.2.7  时域可伸缩扩展定义
7.1.2.8  版权扩展定义
7.1.2.9  内容加密扩展定义
7.1.2.10  高动态范围图像扩展定义
7.1.2.11  目标设备显示和内容元数据扩展定义
7.1.2.12  摄像机参数扩展定义
7.1.2.13  感兴趣区域参数扩展定义
7.1.2.14  参考知识图像扩展定义
7.1.3  图像定义
7.1.3.1  帧内预测图像头定义
7.1.3.2  帧间预测图像头定义
7.1.3.3  图像显示扩展定义
7.1.3.4  图像数据定义
7.1.4  片定义
7.1.5  编码树定义
7.1.6  编码单元定义
7.1.7  变换块定义
7.1.8  自适应修正滤波参数定义
7.2  语义描述
7.2.1  视频扩展
7.2.2  视频序列语义描述
7.2.2.1  视频序列
7.2.2.2  序列头
7.2.2.3  参考图像队列配置集
7.2.2.4  自定义加权量化矩阵
7.2.2.5  扩展和用户数据
7.2.2.5.1  扩展数据
7.2.2.5.2  用户数据
7.2.2.6  序列显示扩展
7.2.2.7  时域可伸缩扩展
7.2.2.8  版权扩展
7.2.2.9  内容加密扩展
7.2.2.10  高动态范围图像扩展
7.2.2.11  目标显示设备和内容元数据扩展
7.2.2.12  摄像机参数扩展
7.2.2.13  感兴趣区域参数扩展
7.2.2.14  参考知识图像扩展
7.2.3  图像
7.2.3.1  帧内预测图像头
7.2.3.2  帧间预测图像头
7.2.3.3  图像显示扩展
7.2.4  片
7.2.5  编码树
7.2.6  编码单元
7.2.7  变换块
7.2.8  自适应修正滤波参数
8  解析过程
8.1  k阶指数哥伦布码
8.2  ue(v)和se(v))的解析过程
8.3  ae(v)的解析过程
8.3.1  概述
8.3.2  初始化
8.3.2.1  初始化二元符号模型
8.3.2.2  初始化熵编码解码器
8.3.3  二元符号串解析
8.3.3.1  概述
8.3.3.2  导出二元符号模型
8.3.3.2.1  导出二元符号模型
8.3.3.2.2  确定lcu_qp_delta的ctxIdxInc
8.3.3.2.3  确定qt_split_flag的ctxIdxInc
8.3.3.2.4  确定bet_split_flag的ctxIdxInc
8.3.3.2.5  确定bet_split_type_flag的ctxIdxInc
8.3.3.2.6  确定bet_split_dir_flag的ctxIdxInc
8.3.3.2.7  确定intra_chroma_pred_mode的ctxIdxInc
8.3.3.2.8  确定skip_flag的ctxIdxInc
8.3.3.2.9  确定direct_flag的ctxIdxInc
8.3.3.2.10  确定intra_cu_flag的ctxIdxInc
8.3.3.2.11  确定inter_pred_ref_mode的ctxIdxInc
8.3.3.2.12  确定pu_reference_index_l0或pu_reference_index_l1的ctxIdxInc
8.3.3.2.13  确定mv_diff_x_abs或mv_diff_y_abs的ctxIdxInc
8.3.3.2.14  确定intra_luma_pred_mode的ctxIdxInc
8.3.3.2.15  确定ctp_zero_flag的ctxIdxInc
8.3.3.2.16  确定coeff_run或coeff_level_minus1的ctxIdxInc
8.3.3.2.17  确定coeff_last的ctxIdxInc和ctxIdxIncW
8.3.3.3  二元符号解析
8.3.3.3.1  解析过程
8.3.3.3.2  decode_decision
8.3.3.3.3  decode_aec_stuffing_bit
8.3.3.3.4  decode_bypass
8.3.3.3.5  update_ctx
8.3.4  反二值化方法
8.3.4.1  概述
8.3.4.2  采用截断一元码的反二值化方法
8.3.4.3  采用一元码的反二值化方法
8.3.4.4  采用标记位的反二值化方法
8.3.4.5  lcu_qp_delta的反二值化方法
8.3.4.6  sao_merge_type_index的反二值化方法
8.3.4.7  sao_interval_start_pos的反二值化方法
8.3.4.8  sao_interval_delta_pos_minus2的反二值化方法
8.3.4.9  sao_edge_offset[compIdx][j]的反二值化方法
8.3.4.10  sao_edge_type的反二值化方法
8.3.4.11  umve_dir_idx的反二值化方法
8.3.4.12  inter_pred_ref_mode的反二值化方法
8.3.4.13  mv_diff_x_abs_l0、mv_diff_y_abs_l0、mv_diff_x_abs_l1和mv_diff_y_abs_l1的反二值化方法
8.3.4.14  intra_luma_pred_mode的反二值化方法
8.3.4.15  coeff_run和coeff_level_minus1的反二值化方法
9  解码过程
9.1  序列解码
9.2  图像解码
9.2.1  概述
9.2.2  图像头解码
9.2.3  构建参考图像队列
9.2.4  更新解码图像缓冲区
9.2.5  输出解码图像
9.2.6  确定加权量化矩阵
9.2.6.1  概述
9.2.6.2  确定4(4和8x8加权量化矩阵
9.2.6.3  M1(M2加权量化矩阵的导出方法
9.2.6.4  M1(M2加权量化矩阵的修正方法
9.3  片解码
9.4  最大编码单元解码
9.5  编码单元解码
9.5.1  概述
9.5.2  确定量化参数
9.5.3  编码单元类型和相关信息
9.5.4  相邻块
9.5.5  确定编码单元划分为变换块的方式
9.5.6  帧内预测模式
9.5.7  参考图像选择
9.5.8  运动信息
9.5.8.1  概述
9.5.8.2  运动信息导出
9.5.8.3  获得相邻块空域运动信息存储单元
9.5.8.4  运动矢量预测
9.5.8.4.1  概述
9.5.8.4.2  普通运动矢量预测
9.5.8.4.3  仿射运动矢量预测
9.5.8.4.4  扩展精度运动矢量预测
9.5.8.5  运动矢量解码
9.5.8.5.1  概述
9.5.8.5.2  普通运动矢量解码
9.5.8.5.3  仿射运动矢量解码
9.5.8.6  跳过模式和直接模式的运动信息导出
9.5.8.6.1  概述
9.5.8.6.2  运动信息导出方法1
9.5.8.6.2.1  概述
9.5.8.6.2.2  方法1.1
9.5.8.6.2.3  方法1.2
9.5.8.6.3  运动信息导出方法2
9.5.8.6.3.1  概述
9.5.8.6.3.2  方法2.1
9.5.8.6.3.3  方法2.2
9.5.8.6.3.4  方法2.3
9.5.8.6.3.5  方法2.4
9.5.8.6.4  高级运动矢量表达运动信息导出方法
9.5.8.6.5  历史运动信息候选项导出方法
9.5.8.6.6  仿射运动信息导出方法
9.6  变换块解码
9.6.1  概述
9.6.2  反量化
9.6.3  反变换
9.7  帧内预测
9.7.1  概述
9.7.2  亮度参考样本的获得
9.7.3  色度参考样本的获得
9.7.4  亮度预测块帧内预测
9.7.4.1  概述
9.7.4.2  预测方法
9.7.4.3  帧内预测滤波
9.7.5  色度预测块帧内预测
9.8  帧间预测
9.8.1  预测样本导出
9.8.1.1  概述
9.8.1.2  普通预测样本导出
9.8.1.3  仿射预测样本导出
9.8.2  亮度样本插值过程
9.8.2.1  概述
9.8.2.2  普通亮度样本插值过程
9.8.2.3  仿射亮度样本插值过程
9.8.3  色度样本插值过程
9.8.3.1  概述
9.8.3.2  普通色度样本插值过程
9.8.3.3  仿射色度样本插值过程
9.9  预测补偿
9.10  去块效应滤波
9.10.1  概述
9.10.2  是否跳过去块效应滤波的判断
9.10.3  边界滤波强度的推导过程
9.10.4  亮度分量Bs等于4时的边界滤波过程
9.10.5  亮度分量Bs等于3时的边界滤波过程
9.10.6  亮度分量Bs等于2时的边界滤波过程
9.10.7  亮度分量Bs等于1时的边界滤波过程
9.10.8  色度分量Bs大于0时的边界滤波过程
9.11  样值偏移补偿
9.11.1  概述
9.11.2  导出样值偏移补偿单元
9.11.3  导出样值偏移补偿信息
9.11.4  样值偏移补偿操作
9.11.4.1  SAO_Interval模式的操作
9.11.4.2  SAO_Edge模式的操作
9.11.4.3  SAO_Off模式的操作
9.12  自适应修正滤波
9.12.1  概述
9.12.2  自适应修正滤波系数解码
9.12.3  导出自适应修正滤波单元
9.12.4  确定亮度分量自适应修正滤波单元自适应修正滤波系数索引
9.12.5  自适应修正滤波操作
9.13  运动信息存储
9.13.1  时域运动信息存储
9.13.2  空域运动信息存储
9.14  判断运动信息的异同
9.15  判断参考帧的异同
9.16  更新历史运动信息表
9.17  仿射运动矢量继承
9.18  仿射运动单元子块运动矢量阵列的导出
A
A
附 录 A (规范性附录) 伪起始码方法
B
B
附 录 B (规范性附录) 档次和级别
B.1  概述
B.2  档次
B.3  级别
B.3.1  本部分定义的级别
B.3.2  与档次无关的级别限制
C
C
附 录 C (规范性附录) 位流参考缓冲区管理
C.1  概述
C.2  约定
C.2.1  约定一
C.2.2  约定二
C.2.3  约定三
C.3  基本操作
C.3.1  数据输入
C.3.1.1  概述
C.3.1.2  方法一
C.3.1.2.1  操作过程
C.3.1.2.2  视频序列开始时的歧义性
C.3.1.2.3  视频序列结束时的歧义性
C.3.1.3  方法二
C.3.2  数据移出
C.3.2.1  概述
C.3.2.2  非低延迟
C.3.2.3  低延迟
C.4  缓冲区检测时间间隔
D
D
附 录 D (规范性附录) 加权量化矩阵
E
E
附 录 E (资料性附录) 高动态范围恒定亮度系统视频信号重建的参考实现方法
E.1  概述
E.2  语法和语义
E.2.1  语法描述
E.2.2  语义描述
E.3  高动态范围信号的重建过程
F
F
附 录 F (资料性附录) 高动态范围场景亮度保真光电转移函数
F.1  概述
F.2  术语和定义
F.2.1
F.2.2
F.2.3
F.2.4
F.2.5
F.2.6
F.3  电光转移函数
F.4  光电转移函数
G
G
附 录 G (规范性附录) 扫描表
H
H
附 录 H (资料性附录) 高级熵编码器解码器参考描述方法
I
I
附 录 I (规范性附录) 反变换矩阵
I.1  DCT2型反变换矩阵
I.1.1  4(4 DCT2反变换矩阵
I.1.2  8(8 DCT2反变换矩阵
I.1.3  16(16 DCT2反变换矩阵
I.1.4  32(32 DCT2反变换矩阵
I.1.5  64(64 DCT2反变换矩阵
I.2  DCT8型反变换矩阵
I.2.1  4(4 DCT8反变换矩阵
I.2.2  8(8 DCT8反变换矩阵
I.2.3  16(16 DCT8反变换矩阵
I.3  DST7型反变换矩阵
I.3.1  4(4 DST7反变换矩阵
I.3.2  8(8 DST7反变换矩阵
I.3.3  16(16 DST7反变换矩阵
数字音视频编解码技术标准工作组 来源: 标题: 状态: 视频组 AVS3-P2 草案(FCD2.0) 视频组通过 AVS-N2805 (非最终标准版本,AVS 工作组保留最终解释权) AVS-N2805,禁止修改
此公开版本非最终标准,版权归AVS工作组,AVS工作组保留修 改的权利,最终解释权由AVS工作组所有。 I AVS-N2805,禁止修改
目 次 前言 ................................................................................. II 引言 ................................................................................ III 1 范围 ............................................................................... 1 2 规范性引用文件 ..................................................................... 1 3 术语和定义 ......................................................................... 1 4 缩略语 ............................................................................. 7 5 约定 ............................................................................... 8 6 编码位流的结构 .................................................................... 15 7 位流的语法和语义 .................................................................. 19 8 解析过程 .......................................................................... 75 9 解码过程 .......................................................................... 98 附录 A(规范性附录) 伪起始码方法 .................................................. 164 附录 B(规范性附录) 档次和级别 .................................................... 165 附录 C(规范性附录) 位流参考缓冲区管理 ............................................ 173 附录 D(规范性附录) 加权量化矩阵 .................................................. 177 附录 E(资料性附录) 高动态范围恒定亮度系统视频信号重建的参考实现方法 ............... 178 附录 F(资料性附录) 高动态范围场景亮度保真光电转移函数 ............................. 181 附录 G(规范性附录) 扫描表 ........................................................ 183 附录 H(资料性附录) 高级熵编码器解码器参考描述方法 ................................. 186 II AVS-N2805,禁止修改
前 言 AVS3分为以下3个部分: ——第 1 部分:系统; ——第 2 部分:视频; ——第 3 部分:音频。 本部分为AVS3的第2部分。 本部分按照GB/T 1.1—2009《标准化工作导则 第1部分:标准的结构和编写》给出的规则起草。 本部分由全国信息技术标准化技术委员会(SAC/TC 28)提出并归口。 本部分起草单位:北京大学、鹏城实验室、华为技术有限公司、深圳市大疆创新科技有限公司、 浙江大学、清华大学、三星电子株式会社、上海海思技术有限公司、北京大学深圳研究生院、中山大 学、北京字节跳动科技有限公司、上海大学、联发博动科技(北京)有限公司、上海国茂数字技术有限 公司、哈尔滨工业大学、中国科学院计算技术研究所、武汉大学、中国科学技术大学、电子科技大学。 本部分起草人:高文、黄铁军、马思伟、郑萧桢、郑建铧、梁凡、王苫社、杨海涛、虞露、何芸、 王荣刚、赵海武、王稷、李忠良、赵日洋、范晓鹏、林和源、张嘉琪、李俊儒、傅天亮、张玉槐、赵寅、 张莉、朴银姬、王振宇、范奎、马祥、郑建成、欧阳晓、王凡、王力强、牛犇犇、高小丁、谢熙、许桂 森、陈焕浜、鲁晓牧、何鸣、马海川、李一鸣、王梦杨。 III AVS-N2805,禁止修改
引 言 本文件的发布机构提请注意,声明符合本文件时,可能涉及到XXXX中如下XXX项与数字视频编解码 技术相关的专利的使用。专利名称如下: …… 本文件的发布机构对于该专利的真实性、有效性和范围无任何立场。 该专利持有人已向本文件的发布机构保证,他愿意同任何申请人在合理且无歧视的条款和条件下, 就专利授权许可进行谈判。该专利持有人的声明已在本文件的发布机构备案,相关信息可以通过以下联 系方式获得: 联 系 人:黄铁军(数字音视频编解码技术标准工作组秘书长) 通讯地址:北京大学理科2号楼2641室 邮政编码:100871 电子邮件:tjhuang@pku.edu.cn 电 话:+8610-62756172 传 真:+8610-62751638 网 址:http://www.avs.org.cn 请注意除上述专利外,本文件的某些内容仍可能涉及专利。本文件的发布机构不承担识别这些专利 的责任。 IV AVS-N2805,禁止修改
1 范围 AVS3 第 2 部分:视频 AVS3的本部分规定了适应多种比特率、分辨率和质量要求的高效视频压缩方法的解码过程。 本部分适用于电视广播、数字电影、网络电视、网络视频、视频监控、实时通信、即时通信、数字 存储媒体、静止图像等应用。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GY/T 155-2000 高清晰度电视节目制作及交换用视频参数值 ISO 11664-1/CIE S 014-1 色度 第1部分:标准比色观测器(Colorimetry – Part 1: Standard Colorimetric Observers) ISO 11664-3/CIE S 014-3 色度 第3部分:CIE三色值(Colorimetry - Part 3: CIE Tristimulus Values) CIE S 015 室外工作场景照明(Lighting of Outdoor Workplaces) 3 术语和定义 下列术语和定义适用于本文件。 3.1 B图像 B picture 帧间预测中可使用知识图像、显示顺序上过去的和将来的图像作为参考图像进行解码的图像。 3.2 保留 reserved 定义了一些特定语法元素值,这些值用于将来对本部分的扩展。 注:这些值不应出现在符合本部分的位流中。 3.3 变换系数 transform coefficient 变换域上的一个标量。 3.4 编码单元 coding unit 包括一个亮度编码块和对应的色度编码块,由最大编码单元划分得到。 3.5 编码块 coding block 一个M×M的样值块。编码块由最大编码块划分得到。 3.6 编码图像 coded picture 一幅图像的编码表示。 3.7 1 AVS-N2805,禁止修改
补偿后样本 compensated sample 经预测补偿得到的样本。 3.8 残差 residual 样本或数据元素的重建值与其预测值之差。 3.9 参考索引 reference index 参考图像在参考图像队列中的编号。其中在参考图像队列0中的编号称为L0参考索引,在参考图像 队列1中的编号称为L1参考索引。 3.10 参考图像 reference picture 解码过程中用于后续图像帧间预测的图像。 3.11 参考图像队列 reference picture list 当前图像的参考图像所组成的图像队列,可包括参考图像队列0和参考图像队列1。 3.12 参考图像队列0 reference picture list 0 当前图像的参考图像所组成的图像队列0,可包括显示顺序上过去的和将来的图像。 3.13 参考图像队列1 reference picture list 1 当前图像的参考图像所组成的图像队列1,可包括显示顺序上过去的和将来的图像。 3.14 参考图像缓冲区 reference picture buffer 保存解码图像并用于预测的缓冲区。 3.15 层 layer 位流中的分级结构,高层包含低层。编码层由高到低依次为:序列、图像、片、最大编码单元、编 码单元和编码块。 3.16 场 field 由构成帧的三个样本矩阵中相间的行构成。 3.17 重建样本 reconstructed sample 由解码器根据位流解码得到并构成解码图像的样本。 3.18 二元符号 bin 组成二元符号串的符号,包括‘0’和‘1’。 3.19 二元符号串 bin string 有限位二元符号组成的有序序列,最左边符号是最高有效位最右边符号是最低有效位。 3.20 反变换 inverse transform 将变换系数矩阵转换成空域样值矩阵的过程。 3.21 反量化 dequantization 对量化系数缩放后得到变换系数的过程。 3.22 2 AVS-N2805,禁止修改
仿射控制点运动矢量组 affine control point motion vectors 用于计算仿射预测子块运动矢量的参考运动矢量,包含两个或三个运动矢量。 3.23 仿射预测单元 affine prediction unit 由多个子块组成,每个子块由一个4×4或8×8的亮度预测块和对应的色度预测块组成。各子块的运 动矢量可不同。 3.24 仿射运动信息 affine motion information 用于仿射预测单元的帧间预测的六元组,由仿射类型(四参数或六参数)、参考预测模式、L0运动 矢量、L1运动矢量、L0参考索引和L1参考索引构成。 3.25 分量 component 图像的三个样值矩阵(亮度和两个色度)中的一个矩阵或矩阵中的单个样值。 3.26 光栅扫描 raster scan 将二维矩形光栅映射到一维光栅,一维光栅的入口从二维光栅的第一行开始,然后扫描第二行、第 三行,依次类推。光栅中的行从左到右扫描。 3.27 划分 partition 将一个集合分为子集。集合中的每个元素属于且只属于某一个子集。 3.28 划分方式 partition type 划分获得的子集的组织方式。 3.29 I图像 I picture 只使用帧内预测解码的图像。 3.30 级别 level 在某一档次下对语法元素和语法元素参数值的限定集合。 3.31 解码顺序 decoding order 解码过程根据图像之间的预测关系,对每幅图像解码的顺序。 3.32 解码图像 decoded picture 解码器根据位流重建的图像。 3.33 解码图像缓冲区 decoded picture buffer 保存解码图像并用于输出重排序和输出定时的缓冲区。 注:包括参考图像缓冲区。 3.34 解析过程 parse 由位流获得语法元素的过程。 3.35 禁止 forbidden 3 AVS-N2805,禁止修改
分享到:
收藏