logo资料库

基于TMS320VC5509A的语音识别与控制系统.pdf

第1页 / 共4页
第2页 / 共4页
第3页 / 共4页
第4页 / 共4页
资料共4页,全文预览结束
嵌入式技术 Embedded Technology 基于TMS320VC5509A的语音识别与控制系统 关 胜 平 , 何 培 宇 , 刘 珂 含 , 李 锦 , 田 芳 芳 , 王 三 山 ( 四 川 大 学 电 子 信 息 学 院 , 四 川 成 都 610064) 摘 要 : 设 计 并 实 现 了 一 种 基 于 定 点 数 字 信 号 处 理 器 ( DSP) 的 语 音 识 别 与 控 制 系 统 。 由 音 频 编 解 码 芯 片 ( TLV320AIC23) 负 责 采 集 语 音 信 号 ; 以 定 点 DSP ( TMS320VC5509A) 作 为 运 算 处 理 单 元 ; 通 过 定 点 运 算 与 浮 点 运 算 的 有 机 结 合 , 解 决 了 处 理 速 度 与 处 理 精 度 之 间 的 矛 盾 ; 在 保 证 处 理 速 度 的 前 提 下 , 提 高 了 运 算 精 度 和 识 别 率 。 关 键 词 : 定 点 DSP 定 点 运 算 浮 点 运 算 端 点 检 测 模 板 匹 配 语 音 识 别 ( Speech Recognition ) 是 机 器 通 过 训 练 和 匹 配 过 程 把 语 音 信 号 转 变 为 相 应 的 文 本 或 命 令 的 技 术 。关 于 语 音 识 别 技 术 , 先 后 出 现 了 动 态 时 间 弯 折 ( DTW) 、隐 马 尔 可 夫 和 人 工 神 经 网 络 三 种 主 要 方 法 [1]。由 于 每 种 方 法 都 涉 及 大 量 的 乘 加 运 算 , 并 且 计 算 精 度 是 算 法 性 能 的 有 效 保 障 , 因 此 对 处 理 器 的 运 算 能 力 要 求 较 高 。近 年 大 规 模 集 成 电 路 的 快 速 发 展 , 为 语 音 识 别 的 实 现 创 造 了 硬 件 条 件 。 目 前 , 基 于 DSP 的 语 音 识 别 系 统 多 以 浮 点 型 DSP 为 主 [2], 但 其 成 本 较 高 。 本 文 以 TI 公 司 的 较 低 成 本 定 点 DSP TMS320VC5509A 作 为 处 理 芯 片 。 在 软 件 编 程 时 , 考 虑 运 算 速 度 和 精 度 对 性 能 的 影 响 , 将 定 点 运 算 与 基 于 定 点 DSP 的 浮 点 运 算 巧 妙 结 合 , 既 保 证 了 处 理 速 度 , 又 提 高 了 运 算 精 度 和 识 别 率 。 此 外 , 该 系 统 的 DSP 芯 片 自 带 USB 接 口 , 可 使 程 序 下 载 不 借 助 于 硬 件 仿 真 器 , 便 于 推 广 应 用 ; 可 编 程 逻 辑 器 件 ( CPLD) 能 够 根 据 识 别 结 果 发 出 相 应 的 控 制 信 号 以 驱 动 各 种 控 制 对 象 ; 外 扩 Flash 达 1M×16Bit , 不 仅 能 存 储 较 多 数 量 的 模 板 , 也 可 实 现 程 序 的 并 行 加 载 , 使 系 统 能 够 脱 机 运 行 , 便 于 携 带 。 通 过 对 语 音 信 号 的 采 集 与 识 别 , 能 够 完 成 对 特 定 人 、小 词 汇 量 、 孤 立 词 的 识 别 , 并 且 能 发 出 相 应 的 控 制 信 号 , 以 达 到 系 统 的 设 计 要 求 。 实 践 验 证 了 该 系 统 具 有 可 靠 性 、稳 定 性 和 灵 活 性 。 1 语 音 识 别 原 理 语 音 识 别 原 理 框 图 如 图 1 所 示 。 语 音 信 号 输 入 之 后 , 预 处 理 和 数 字 化 是 进 行 语 音 识 别 的 前 提 条 件 。其 中 , 预 处 理 主 要 是 进 行 预 滤 波 , 保 留 正 常 人 的 300 ~3400Hz 的 语 音 信 号 ; 数 字 化 是 要 进 行 A/D 转 换 及 抗 混 叠 等 处 理 ; 特 征 提 取 是 进 行 语 音 信 号 训 练 和 识 别 必 不 可 少 的 步 骤 。能 够 体 现 语 音 信 号 特 征 的 参 数 包 括 : (1)基 于 LPC 的 倒 谱 参 数 ; (2)Mel 系 数 的 倒 谱 参 数 ; (3)采 用 前 沿 数 字 信 号 处 理 技 术 的 特 征 分 析 手 段 , 如 小 波 分 析 、 时 / 频 域 分 析 、人 工 神 经 网 络 等 。 本 文 采 用 基 于 LPC 的 倒 谱 参 数 表 示 方 法 , 提 取 出 的 特 征 值 存 入 参 考 模 式 库 中 , 用 来 匹 配 待 识 别 语 音 信 号 的 特 征 值 。匹 配 计 算 是 进 行 语 音 识 别 的 核 心 部 分 , 由 待 识 别 人 的 语 音 经 过 特 征 提 取 后 , 与 系 统 训 练 时 产 生 的 模 板 进 行 匹 配 , 在 说 话 人 辨 认 中 , 取 与 待 识 别 语 音 相 似 度 最 大 的 模 型 所 对 应 的 语 音 作 为 识 别 结 果 , 这 就 是 语 音 识 别 的 整 个 过 程 [1]。 语 音 输 入 预 处 理 与 数 字 化 特 征 提 取 参 考 模 式 训 练 识 别 匹 配 计 算 结 果 图 1 语 音 识 别 的 原 理 框 图 2 硬 件 结 构 部 分 本 系 统 的 硬 件 结 构 框 图 如 图 2 所 示 。 语 音 信 号 CODEC DSP SDRAM TLV320AIC23 TMS320VC5509A HY57V641620 等 控 制 对 象 CPLD FLASH EPM3128ATC100- 10 SST39VF1601 图 2 系 统 硬 件 结 构 框 图 此 系 统 的 核 心 器 件 是 TI 公 司 的 TMS320VC5509A 定 点 DSP 芯 片 。 它 是 系 统 的 运 算 处 理 单 元 , 具 有 2 个 乘 法 器 (MAC), 4 个 累 加 器 (ACC); 40 位 、16 位 的 算 术 逻 辑 单 元 (ALU)各 一 个 , 这 大 大 增 强 了 DSP 的 运 算 能 力 ; 指 令 字 长 不 只 单 一 的 16 位 , 可 扩 展 到 最 高 48 位 , 数 据 字 长 16 位 ; 在 144MHz 下 工作, 指令 周期可 达 6.94ns。TMS320VC5509A 还提供高速的多通道缓 冲串 口 McBSP(Multi- channel Buffer- erd Serial Ports) , DSP 可 通 过 McBSP 与 其 他 DSP 、编 解 码 器 等 器 件 相 连 。McBSP 具 有 全 双 工 通 信 , 双 缓 冲 数 据 寄 存 器 , 允 许 传 送 连 续 的 数 据 流 , 能 够 向 CPU 发 送 中 断 , 向 DMA 控 制 器 发 送 DMA 事 件 , 可 设 置 帧 同 步 脉 冲 和 时 钟 信 号 的 极 性 等 功 能 , 这 大 大 方 便 了 DSP 采 集 音 频 信 号 [3]。 36 欢迎网上投稿 www.aetnet.cn www.aetnet.com.cn 《电子技术应用》2007 年第 7 期
嵌入式技术 Embedded Technology 除 此 之 外 , TMS320VC5509A 还 提 供 了 更 为 高 效 的 外 部 存 储 器 接 口 ( EMIF ) , 以 往 DSP 的 空 间 选 通 信 号 被 片 选 信 号 取 代 , 而 每 个 片 选 信 号 分 别 占 用 不 同 的 地 址 空 间 , 这 样 就 不 需 要 外 部 的 译 码 电 路 , 从 而 实 现 了 与 外 部 设 备 的 无 缝 连 接 , 可 使 DSP 外 部 存 储 空 间 扩 大 到 满 足 系 统 要 求 。 值 得 强 调 的 是 , 可 通 过 USB 接 口 对 TMS320VC5509A 烧 写 程 序 而 不 必 借 助 仿 真 器 。 正 是 基 于 这 些 优 点 , 选 择 该 芯 片 可 节 省 开 发 资 金 , 减 小 电 路 板 面 积 。 TLV320AIC23 是 TI 公 司 的 一 款 低 成 本 、低 功 耗 的 音 频 编 解 码 芯 片 (CODEC), 在 本 系 统 中 负 责 采 集 语 音 信 号 。 它 与 本 系 统 相 关 的 性 能 参 数 如 下 : (1 ) 支 持 8kHz~96kHz 可 调 采 样 率 ; (2)与 DSP 连 接 , 主 从 类 型 可 通 过 软 件 编 写 来 实 现 ; (3)DSP 可 通 过 I2C 总 线 来 配 置 TLV320AIC23 的 寄 存 器 ; (4)采 集 语 音 信 号 字 长 16/20/24/32Bit ; (5)MIC 音 频 输 入 具 有 强 抗 噪 性 ; (6 ) 具 有 可 调 1 ~5dB 的 完 整 缓 存 放 大 系 统 [4]。 EPM3128ATC100 - 10 可 编 程 逻 辑 器 件 (CPLD) 在 本 系 统 中 担 当 两 方 面 的 职 能 : (1)作 为 控 制 部 件 , 接 收 DSP 发 出 的 信 号 , 经 逻 辑 判 断 后 , 驱 动 诸 如 电 机 、发 光 二 极 管 等 器 件 ; (2)用 于 DSP 地 址 线 的 扩 展 。TMS320VC5509A 只 有 14 根 地 址 线 , 但 它 的 外 部 存 储 空 间 可 以 扩 展 到 16MB(字 节 寻 址 ), 显 然 , DSP 的 固 有 地 址 线 是 无 法 满 足 要 求 的 。 本 系 统 采 用 CPLD 完 成 地 址 线 的 扩 展 [5][6]。 HY57V641620 同 步 动 态 存 储 器(SDRAM), 容 量 为 4M× 16Bit 。 作 为 RAM 的 扩 展 , 大 大 增 强 了 DSP 的 存 储 与 运 算 能 力 [7]。 SST39VF1601 闪 存 存 储 器 (Flash), 容 量 为 1M×16Bit。 在 这 个 系 统 中 [8], 它 主 要 用 来 存 储 程 序 代 码 。 上 电 后 , DSP 从 外 部 Flash 加 载 并 执 行 程 序 代 码 , 使 系 统 能 够 脱 机 运 行 。 3 软 件 模 块 部 分 软 件 流 程 如 图 3 所 示 。 系 统 采 集 语 音 信 号 后 , 首 先 要 进 行 预 滤 波 和 预 加 重 ; 接 着 将 语 音 信 号 进 行 分 帧 , 由 于 语 音 信 号 具 有 极 强 的 相 关 性 , 因 此 在 分 帧 时 , 要 考 虑 帧 重 复 。本 文 将 语 音 信 号 以 256 个 采 样 点 为 一 帧 , 两 帧 之 间 的 重 复 点 数 为 80 ; 然 后 计 算 每 帧 信 号 的 短 时 能 量 与 短 时 平 均 过 零 率 , 这 也 是 接 下 来 进 行 端 点 检 测 的 依 据 ; 利 用 门 限 判 决 进 行 端 点 检 测 后 , 提 取 每 帧 信 号 的 LPC 系 数 , 作 为 该 帧 信 号 的 特 征 值 ; 最 后 , 用 语 音 信 号 的 特 征 值 与 模 板 逐 个 进 行 匹 配 。 相 似 度 最 大 的 模 板 所 对 应 的 语 音 信 号 为 识 别 结 果 , 根 据 识 别 结 果 就 可 以 向 外 发 出 控 制 信 号 。 3 . 1 端 点 检 测 端 点 检 测 就 是 要 从 采 集 的 信 号 中 检 测 出 说 话 人 的 命 令 字 。 此 系 统 中 , 对 语 音 信 号 进 行 了 分 帧 操 作 , 一 种 简 便 的 方 法 就 是 获 取 说 话 人 命 令 字 的 起 始 帧 数 , 具 体 操 作 是 通 过 求 一 帧 信 号 的 短 时 能 量 和 短 时 平 均 过 零 率 来 判 断 的 。 语 音 信 号 的 短 时 能 量 分 析 给 出 了 反 应 其 幅 度 变 化 的 一 个 合 适 描 述 方 法 。 一 帧 语 音 信 号 的 短 时 能 量 定 义 为 : n + N- 1 En= m= n! x2 ! (m) (1) 短 时 过 零 率 , 即 指 每 帧 内 信 号 通 过 零 值 的 次 数 , 能 够 在 一 定 程 度 上 反 映 信 号 的 频 谱 特 性 。一 帧 语 音 信 号 内 短 时 平 均 过 零 率 定 义 为 : Zn= 1 2 n + N- 1 m= n! sgn[x ! (m)]- sgn[x ! (m- 1)] (2) 在 正 式 端 点 检 测 开 始 后 , 短 时 能 量 与 短 时 平 均 过 零 率 一 起 做 为 门 限 来 判 决 说 话 人 命 令 字 的 开 始 与 结 束 : 连 续 5 帧 语 音 信 号 超 过 门 限 值 视 为 说 话 人 命 令 字 的 开 始 , 连 续 8 帧 语 音 信 号 低 于 门 限 值 视 为 说 话 人 命 令 字 的 结 束 。 3 . 2 特 征 值 提 取 此 系 统 以 语 音 信 号 的 线 性 预 测 系 数 ( LPC) 作 为 特 征 值 。 采 用 自 相 关 法 获 取 LPC 系 数 , 先 计 算 每 帧 语 音 信 号 的 13 阶 自 相 关 函 数 , 定 义 为 : n + N- k - 1 Rn(k)= m= n! x ! (m)x ! (m+k) k=1 , 2 , … , 13 (3) 得 到 自 相 关 函 数 后 , 采 用 莱 文 逊 — 杜 宾 递 推 算 法 计 算 线 性 预 测 系 数 , 得 到 说 话 人 一 个 命 令 字 的 LPC 系 数 矩 阵 , 大 小 为 : 命 令 字 帧 数 ×12 。 3 . 3 模 板 匹 配 ( DTW 算 法 ) 模 板 匹 配 就 是 把 上 述 计 算 得 到 的 LPC 系 数 矩 阵 中 的 元 素 与 事 先 存 在 DSP 中 的 模 板 元 素 进 行 差 值 计 算 。在 此 系 统 中 , 采 用 动 态 时 间 弯 折 ( DTW) 算 法 : 假 设 参 考 模 板 的 LPC 系 数 向 量 序 列 为 X=(x1, x2, … , xI), 输 入 语 音 的 LPC 系 数 向 量 序 列 为 Y=(y1, y2, … , yJ), I ≠J 。 DTW 算 法 就 是 要 寻 找 一 个 最 佳 的 时 间 规 正 函 数 , 使 待 测 语 音 的 时 间 轴 j 非 线 性 地 映 射 到 参 考 模 板 的 时 间 轴 i 上 , 使 总 的 累 计 差 值 最 小 [1]。 算 法 过 程 如 图 4 所 示 。 图 4 中 曲 线 连 接 起 来 的 点 就 是 模 板 与 待 测 语 音 信 号 间 的 距 离 d (xi (n), yj (n)), 亦 称 为 局 部 匹 配 距 离 。 DTW 算 法 就 是 通 过 局 部 优 化 的 方 法 实 现 加 权 距 离 总 和 最 小 , 也 就 是 相 似 度 最 大 , 定 义 为 : N D=min n = 1!d(xi (n), yj (n)) 3 . 4 小 数 的 定 点 运 算 (4) 在 进 行 语 音 信 号 处 理 时 , 通 常 要 先 对 其 进 行 归 一 《电子技术应用》2007 年第 7 期 欢迎订购《电子技术应用》2000~2006 年合订光盘(010- 82306084) 37
嵌入式技术 Embedded Technology 15 i 10 间 时 板 模 考 参 5 1 0 1 5 10 15 20 待 测 语 音 时 间 j 图 4 动 态 时 间 弯 折 (DTW) 算 法 过 程 化 , 使 得 语 音 信 号 |x(n)| ≤1 , 为 后 面 计 算 自 相 关 函 数 及 求 LPC 系 数 提 供 方 便 。 这 样 就 面 临 一 个 实 际 问 题 : 对 定 点 DSP 而 言 , 参 与 数 值 运 算 的 数 是 16 位 二 进 制 整 型 数 , 而 DSP 芯 片 如 何 处 理 小 数 运 算 呢 ? 方 法 是 确 定 一 个 数 的 小 数 点 处 于 16 位 中 的 某 一 位 , 这 也 就 是 数 值 的 定 标 问 题 , 举 例 如 下 : (19AB)16=(31147)10 (19AB)16=(0.95)10 Q0 定 标 Q15 定 标 由 此 可 见 , 对 于 定 点 DSP 芯 片 内 部 而 言 , 一 个 16 位 整 型 数 到 底 表 示 多 少 , 它 本 身 是 不 能 够 分 辨 的 , 必 须 通 在 端 点 检 测 完 成 之 后 , 要 先 将 定 点 运 算 转 换 为 浮 点 运 算 ; 提 取 LPC 系 数 之 后 , 再 将 浮 点 运 算 转 换 为 定 点 运 算 进 行 匹 配 。 以 牺 牲 少 量 运 算 时 间 为 代 价 , 适 当 提 高 运 算 精 度 和 识 别 率 。 实 验 证 明 , 这 是 可 行 的 。 4 测 试 方 法 及 结 果 下 面 用 两 种 实 验 方 法 来 测 试 此 系 统 的 性 能 。 实 验 1: 用 CPLD 的 输 出 信 号 来 驱 动 两 个 步 进 电 机 R 和 L, 某 特 定 人 的 四 个 命 令 信 号 “走 ”, “左 ”, “右 ”, “停 ”控 制 这 两 个 电 机 的 运 转 。 对 应 的 实 验 现 象 : 走 —L、R 同 时 转 ; 左 —L 转 , R 停 ; 右 —L 停 , R 转 ; 停 —R、L 都 不 转 。 实 验 2 : 用 CPLD 的 输 出 信 号 驱 动 四 个 发 光 二 极 管 A、B、C、D, 某 特 定 人 的 四 个 命 令 信 号 “1 ”, “2 ”, “3 ”, “4 ”来 控 制 相 应 发 光 二 极 管 的 亮 灭 。对 应 的 实 验 现 象 : 1 — A 亮 , 其 余 灭 ; 2 — B 亮 , 其 余 灭 ; 3 — C 亮 , 其 余 灭 ; 4 — D 亮 , 其 余 灭 。 以 上 两 个 实 验 , 除 了 测 试 识 别 率 外 , 还 要 比 较 在 计 算 自 相 关 函 数 和 提 取 LPC 系 数 时 , 分 别 采 用 定 点 算 法 、 浮 点 算 法 所 消 耗 机 器 周 期 的 个 数 , 本 系 统 DSP 的 机 器 周 期 为 83.28ns 。由 于 每 次 采 集 的 命 令 字 帧 长 不 确 定 , 以 进 行 十 次 实 验 消 耗 的 机 器 周 期 的 平 均 值 来 统 计 , 测 试 结 果 如 表 1 所 示 。 表 1 试 验 结 果 过 定 标 来 确 定 。 进 行 归 一 化 处 理 就 是 把 数 以 Q15 形 式 定 标 , 为 以 后 的 运 算 做 好 准 备 [2]。 做 小 数 的 定 点 运 算 时 , 还 要 进 行 预 运 算 和 定 点 运 算 ( 识 别 率 , 机 器 周 期 ( 单 位 : 个 ) ) 浮 点 运 算 ( 识 别 率 , 机 器 周 期 ( 单 位 : 个 ) ) 试 验 1 试 验 2 85.4% , 18599 90.3% , 19756 90.5% , 24036 95.1% , 23854 移 位 。 预 运 算 就 是 事 先 估 计 运 算 结 果 , 为 下 一 步 移 位 做 准 备 。 其 实 现 可 采 用 如 Matlab 等 的 辅 助 软 件 。由 于 此 系 统 的 识 别 过 程 涉 及 较 多 的 乘 加 运 算 , 如 几 个 Q15 定 标 的 数 进 行 加 法 运 算 , 结 果 可 能 出 现 溢 出 现 象 , 如 果 不 能 进 行 很 好 的 预 运 算 , 将 对 后 面 的 运 算 产 生 很 大 影 响 ; 移 位 是 小 数 做 定 点 运 算 的 具 体 操 作 。 做 加 、减 、乘 、除 法 时 , 要 严 格 按 照 相 应 的 操 作 方 法 , 每 做 一 个 四 则 运 算 都 要 参 照 实 际 情 况 , 遵 循 先 移 位 、再 做 运 算 、 最 后 再 移 位 的 步 骤 , 以 在 精 度 损 失 最 少 的 情 况 下 保 证 运 算 结 果 的 可 靠 性 。 3 . 5 定 点 DSP 做 浮 点 运 算 定 点 运 算 是 以 DSP 的 实 际 存 储 形 式 ( 16 位 二 进 制 整 型 ) 为 数 值 格 式 进 行 加 、减 、乘 、除 等 四 则 运 算 , 允 许 数 值 的 表 示 范 围 是 : (- 32768)10~(32767)10。定 点 DSP 的 浮 点 运 算 是 人 为 地 开 辟 两 个 16 位 存 储 单 元 来 表 示 一 个 数 值 , 其 中 一 个 用 来 存 储 尾 数 , 另 一 个 用 来 存 储 指 数 , 按 照 自 然 科 学 计 数 法 进 行 四 则 运 算 。 显 而 易 见 , 这 样 的 存 储 计 算 方 法 , 其 精 度 和 动 态 表 示 范 围 都 远 远 高 于 定 点 运 算 。 为 降 低 成 本 , 本 系 统 选 择 了 一 款 定 点 DSP 。 由 于 端 点 检 测 、模 板 匹 配 对 精 度 要 求 不 高 , 所 以 采 用 定 点 算 法 进 行 小 数 运 算 ; 计 算 自 相 关 系 数 、提 取 LPC 系 数 时 , 要 求 精 度 高 , 因 此 采 用 浮 点 算 法 进 行 小 数 运 算 。这 也 意 味 着 , 由 表 1 可 见 , 在 相 同 的 测 试 条 件 下 , 当 采 用 浮 点 运 算 计 算 自 相 关 函 数 和 提 取 LPC 系 数 时 , 尽 管 识 别 率 高 于 定 点 运 算 , 但 是 系 统 消 耗 了 更 多 的 运 算 时 间 。 本 文 设 计 的 语 音 识 别 与 控 制 系 统 , 具 有 体 积 小 、成 本 低 、便 于 携 带 等 优 点 。 在 实 现 系 统 功 能 的 同 时 又 使 板 级 调 试 与 系 统 升 级 变 得 极 为 方 便 , 因 此 可 以 作 为 一 个 处 理 语 音 信 号 的 通 用 硬 件 平 台 , 亦 可 完 成 语 音 编 码 、声 回 波 对 消 等 算 法 的 实 现 。 系 统 在 DSP 提 供 的 地 址 线 少 于 Flash 地 址 线 的 情 况 下 , 由 CPLD 扩 展 了 DSP 的 地 址 线 。 在 不 借 助 硬 件 仿 真 器 的 情 况 下 , 实 现 了 对 Flash 的 在 线 烧 写 , 并 采 用 二 次 引 导 的 方 法 , 完 成 了 程 序 的 并 行 加 载 , 使 系 统 能 够 脱 机 运 行 。 由 CPLD 发 出 相 应 的 识 别 控 制 信 号 , 能 够 驱 动 电 动 机 及 指 示 灯 等 。测 试 结 果 表 明 , 该 系 统 处 理 速 度 快 , 运 行 稳 定 可 靠 , 达 到 设 计 要 求 。 参 考 文 献 [1] 韩 纪 庆 , 张 磊 , 郑 铁 然 . 语 音 信 号 处 理 [M]. 北 京 : 清 华 大 学 出 版 社 , 2004. [2] 张 雄 伟 , 陈 亮 , 徐 光 辉 .DSP 芯 片 的 原 理 与 开 发 应 用 [M]. 北 京 : 电 子 工 业 出 版 社 , 2004. [3] Texas Instruments.TMS320VC5509A Fixed- Point Digital Signal Processor[EB/OL].Texas Instruments Inc , 2006 , 3. www.ti.com. 38 欢迎网上投稿 www.aetnet.cn www.aetnet.com.cn 《电子技术应用》2007 年第 7 期
集成电路应用 Application of Integrated Circuits 基于 H.264 帧间预测解码的研究及高效 VLSI 实现* 杨 海 池 , 宋 锐 , 吴 成 柯 , 冯 晓 茹 (西 安 电 子 科 技 大 学 ISN 国 家 重 点 实 验 室 , 陕 西 西 安 710071) 摘 要 : 在 深 入 研 究 H.264 帧 间 预 测 技 术 的 基 础 上 , 采 用 三 级 流 水 线 实 现 帧 间 预 测 解 码 的 VLSI 设 计 , 并 详 细 介 绍 了 基 于 宏 块 分 割 的 变 块 自 适 应 循 环 控 制 单 元 , 针 对 存 储 器 的 读 写 问 题 提 出 了 一 种 交 织 存 取 方 式 , 针 对 分 像 素 插 值 提 出 了 一 种 基 于 H.264 标 准 的 插 值 运 算 电 路 。通 过 仿 真 及 在 H.264 解 码 器 中 的 实 际 应 用 和 测 试 , 证 明 该 设 计 工 作 稳 定 , 能 够 满 足 H.264 标 准 基 本 框 架 下 4CIF 格 式 图 片 30fps( 帧 / 秒 ) 实 时 解 码 的 要 求 。 关 键 词 : 帧 间 预 测 VLSI 设 计 变 块 大 小 自 适 应 交 织 存 取 插 值 运 算 H.264 [1]是 联 合 视 频 工 作 组 JVT(Joint Video Team) 开 发 的 最 新 一 代 视 频 压 缩 标 准 。与 标 准 MPEG- 2 、MPEG- 4 和 H.263 相 比 , 其 总 体 结 构 为 基 于 增 强 的 运 动 估 计 与 补 偿 加 变 换 编 码 的 混 合 (hybrid)编 码 模 式 , 包 含 了 许 多 新 特 征 : 如 VCL 层 和 NAL 层 分 离 、帧 内 预 测 、高 精 度 运 动 估 计 、可 变 块 大 小 运 动 补 偿 、多 参 考 帧 运 动 补 偿 预 测 、低 复 杂 度 16bit 的 整 数 变 换 和 量 化 、 去 块 效 应 滤 波 器 和 高 效 的 熵 编 码 等 。 这 些 新 特 征 使 得 H.264/AVC 能 够 显 著 提 高 编 码 效 率 且 具 有 网 络 友 好 性 , 可 有 效 用 于 各 种 网 络 和 应 用 环 境 [2]。 作 为 视 频 压 缩 的 关 键 技 术 之 一 , 具 有 运 动 估 计 与 补 偿 的 帧 间 预 测 技 术 主 要 是 利 用 连 续 图 像 之 间 的 相 关 性 , 采 取 运 动 估 计 与 补 偿 的 方 法 来 消 除 时 间 上 的 冗 余 。H.264 解 码 代 码 的 复 杂 度 分 析 结 果 显 示 , 计 算 量 最 大 的 部 分 是 帧 间 预 测 模 块 、帧 内 预 测 模 块 和 去 块 效 应 滤 波 模 块 。 但 这 些 部 分 的 控 制 方 式 相 对 简 单 , 适 合 用 硬 件 来 实 现 。 本 文 在 深 入 研 究 H.264 帧 间 预 测 技 术 的 基 础 上 , 尽 量 降 低 硬 件 资 源 损 耗 , 采 用 三 级 流 水 线 实 现 帧 间 预 测 解 码 的 VLSI 设 计 。 1 帧 间 预 测 技 术 研 究 的 运 动 补 偿 预 测 模 式 。 与 以 往 标 准 帧 间 预 测 不 同 的 是 , H.264 增 加 了 许 多 新 功 能 [3], 主 要 包 括 四 个 方 面 : (1)可 变 块 大 小 运 动 补 偿 : 每 个 宏 块 ( 16 ×16 像 素 ) 的 亮 度 , 可 以 按 4 种 方 式 进 行 分 割 : 1 个 16 ×16 , 或 2 个 16 ×8 , 或 2 个 8 ×16 , 或 4 个 8 ×8 , 其 运 动 补 偿 也 相 应 有 4 种 。 而 8×8 模 式 的 每 个 子 宏 块 可 以 继 续 分 割 : 1 个 8×8, 或 2 个 4×8 , 或 2 个 8×4 , 或 4 个 4×4 。这 种 分 割 下 的 运 动 补 偿 , 称 为 树 状 结 构 运 动 补 偿 。 这 些 分 割 和 子 宏 块 大 大 提 高 了 各 个 宏 块 的 关 联 性 。 一 般 来 说 , 小 块 可 以 提 高 预 测 的 效 果 。 宏 块 的 色 度 成 分 (Cr 和 Cb)则 为 相 应 亮 度 的 一 半 (水 平 和 垂 直 各 一 半 )。 色 度 块 采 用 和 亮 度 块 相 同 的 分 割 模 式 , 只 是 尺 寸 减 半 (水 平 和 垂 直 方 向 都 减 半 )。 例 如 8 ×16 的 亮 度 块 其 相 应 的 色 度 块 尺 寸 为 4×8 。 (2)高 精 度 的 运 动 补 偿 : 帧 间 编 码 宏 块 的 每 个 分 割 或 子 宏 块 都 是 对 参 考 图 像 的 某 一 相 同 尺 寸 区 域 进 行 预 测 得 到 的 。 两 者 之 间 的 差 异 (MV), 对 亮 度 成 分 采 用 1/4 像 素 精 度 , 色 度 1/8 像 素 精 度 。 亚 像 素 位 置 的 亮 度 和 色 度 像 素 并 不 存 在 于 参 考 图 像 中 , 需 要 利 用 临 近 已 编 码 点 进 行 内 插 得 到 。 H.264 帧 间 预 测 是 利 用 已 编 码 视 频 帧 或 场 和 基 于 块 MV 可 由 临 近 已 编 码 分 割 的 MV 预 测 获 得 。 预 测 矢 """""""""""""""""""""""""""""""""""""""""""""""" (接 上 页 ) Date Sheets[EB/OL].Altera Corporation , 2003 , 6.lit_req@al- tera.com. [4] Texas Instruments.TLV320AIC23 Data Manual[EB/OL]. Texas Instruments Inc , 2002 , 1.www.ti.com. [7] Hynix.HY57V641620HG Data Sheets[EB/OL].Hynix Semi- [5] Texas Instruments.TMS320VC5509 Evaluation Module Tech- conductor , 2002 , 1.www.21ic.com. nical Reference[EB/OL].Texas Instruments Inc , 2002 , 1. www.ti.com. [6] Altera.MAX 3000A Programmable Logic Device Family [8] Silicon Storage Technology.SST39VF1601 Data Sheets[EB/ OL].Silicon Storage Technology, Inc , 2003 , 11.www.sst.com. (收 稿 日 期 : 2007- 02- 05) * 基 金 项 目 : 国 家 自 然 科 学 基 金 资 助 项 目 ( 60372043 ) , 重 点 实 验 室 基 金 资 助 项 目 ( 51434050105DZ0101 ) 。 《电子技术应用》2007 年第 7 期 欢迎订购《电子技术应用》2000~2006 年合订光盘(010- 82306084) 39
分享到:
收藏