第 卷 第 期
年 月
北 京 科 技 大 学 学 报
一 种 基 于 视 觉嫡 的 图像 分 割压 缩 方 法
单志 广 魏 涛 杨 扬
北京科技大 学信 息工程学院 , 北 京
摘 要 基 于 视 觉 嫡 概 念 提 出 了一 种 静止 图像 分 割 压 缩 方 法 通 过 对 人 类 视 觉 系统 特 性 的 归纳 ,
总 结 了基 于 视 觉 嫡 的 图像 分 割 原 理 , 提 出 了用 于 量 化 图像 特 征 的数 学 定义 和 基 十 视 觉 嫡 的分
割 算 法 实验 结 果 表 明 , 这 种 基 于 视 觉 嫡 的 图像 分 割 压 缩 算 法 既 提 高 了压 缩 比 , 又 能 保 证 压 缩
后 的 重 建 图像 整 体 上 具 有 高 的 主 观 视 觉 感 知 质 量
关键 词 视 觉 嫡 图像 分 割 图像 编 码
分 类号
图 像 压 缩 编 码 的 理 论 基 础 是 信 息 论 从 信
息 论 的 角 度 看 , 压 缩 就 是 去 掉 信 息 中 的冗 余 , 保
留 不 确 定 的 因 素 , 去 除确 定 的 因 素 , 用 更 接 近 信
息 本 质 的 描 述 来 代 替 原 有 冗 余 的 描 述 这 个 本
质 的 东 西 就 是 信 息 量 即 不 确 定 因 素 但 信 息
量 不 是 孤 立 、 绝 对 的 , 它 与 信 息 的传 递 密 切 相
关 , 信 息 接 受 者 知 识 世 界 的 改 变 是 信 息 传 递 的
本 质 人 眼 是 一 种 最 优 的 图像 编 码 系 统 , 图像 信
息 传 递 的 本 质 特 征 应 该 与 人 眼 的视 觉 特 性 保 持
一 致
近 年 来 人 们 从 人 类 视 觉 系 统
的研 究 中得 到 启 发 , 基 于
的
压 缩 方 法 引 起 了 人 们 的 广 泛 注 意 〔” 对 于 一 幅 图
像 , 人 眼 对 其 中每 个 区 域 的 敏 感 度 是 不 同 的 , 从
而 导 致 了
对 图像 各 个 部 分 的注 意 力 不 均
匀 且 没 有 规 律 , 而 这 决 定 了 人 对 图像 视 觉 信 息
的理 解 如 果 不 考 虑 图像 表 达 的 意 义 , 不 把 图像
内容 与 编 码 方 法 结 合 起 来 , 对 整 个 图 像 一 概 而
论 , 显 然 是 不 合 理 的 为 了 衡 量 图像 信 息量 的大
小 以 及 人 类 视 觉 系 统 对 图 像 的 敏 感 程 度 , 人 们
提 出 了视 觉 嫡
‘,
,的概 念
视 觉嫡
视 觉 嫡 是 信 息 嫡 的 概 念 与 人 类 视 觉 系 统
特 性 的 结 合
信 息嫡 概 念
在 信 息 论 中 , 信 源 中 目标 司 ,
, …,
一
一
收稿 单 志 广 男 , 岁 , 博 士 生
国家 自然科 学 基 金 资助 课 题 氏
的 信 息 量
被 定 义 为
护
一
,
式 中 ,
, 为 ,
信 息 的 嫡
艺 ,
, … , 出 现 的概 率
拭刀 就 是 信 源 中所 有
目标 的 平 均 信 息 量 , 即
州幻 二 一 艺
, 。
嫡 是 一 种 对 不 确 定 问题 的 度 量 准 则 一 幅
图像 的嫡 值 是 它 的平 均 信 息 量 的 量 度 , 图 像 中
有 许 多 信 息 是 冗 余 的 , 去 掉 冗 余 的信 息 , 而 使 压
缩 后 的 图 像 嫡 值 不 低 于 图 像 信 息 源 的 嫡 值 , 则
不 会 丢 失 图像 的 有 用 信 息 这 一 结 论 就 是 图 像
压 缩 编 码 的 依 据
人 类视 觉的生 理特性和 心 理特 性
从 生 理 学 知 , 视 觉 受 到 大 脑 的 选 择 性 注 意
机 制 的控 制 , 人 无 法 同 时 识 别 同 一 复 杂 场 景 内
部 的 多 个 目标 , 只 有 进 入 黄 斑 区 内 的 景 物 信 息
被 充 分 接 收 , 而 之 外 的 大 量 信 息 最 终 被 中心 滤
波 另 外 , 视 觉 选 择 性 与 客 体 的特 性 也 有 很 大 的
关 系 人 眼 对 空 间频 率 接 近 于 零 的 平 滑 区 域 和
空 间 频 率 相 似 的 纹 理 区 域 有 很 大 的 视 觉 “ 钝
性 ” , 所 以 “ 不 变 ” 与 “ 规 则 变 化 ” 的场 景 很 容 易
在 人 的 意 识 中遗 忘 , 视 觉 似 乎 只 对 “ 突 变 ”和 “ 极
不 规 则 变 化 ” 的 区 域 感 兴 趣
从 心 理 学 和 美 学 角 度 讲 , 视 觉 是 具 有 选 择
性 的 研 究表 明 , 人 类 视 觉 的 选 择 性 使 人 们 的 目
标 集 中于 周 围环 境 中使 生 活 变 得更 加 美好 和 那
些 妨 碍 生 活 正 常 进 行 的 方 面 从 而 进 一 步说 明 ,
视 觉 是 一 种 积 极 的 感 受 行 为 , 不 仅 与物 理 和 生
理 因 素 有 关 , 在 相 当程 度 上 也 取 决 于 心 理 因 素
一
北 京 科 技
大 学 学 报
年 第 期
的概 念
一 幅 图 像 的局 部 视 觉 嫡‘ 定 义 为 对 于 一 幅
图 像 的 特 定 区 域 , 在 保 证 编 码 后 的 图 像 与 原 图
像 无 太 大 视 觉 感 知 差 异 的 前 提 下 , 可 获 得 的 编
码 后 的每 个 像 素 的 最 小 比特 数
可 见 , 细 节 少 的 区 域 以较 低 的 比特 数 就 可
以编 码 获 得 高 逼 真 度 , 其 视 觉 嫡 就 低 具 有 重 要
感 知 细 节 的 区 域 视 觉 嫡 就 高 然 而 , 细 节 与 视 觉
嫡 并 不 等 同 因 为 具 有 高细 节 的 区 域 如 随机 纹
理 也 可 能 压 缩 到 很 低 的 比特 率 而 不 会 引 起 感
知 上 的 明 显 扭 曲
视 觉 嫡 对 于 研 究 具 有 可 变 感 知 级 别 的 编 码
是 一 种 概 念 上 的 指 导 视 觉 嫡 描 述 的 是 人 眼 对
信 息 的 一 种 主 观 量 度 , 是 对
的 一 种 很 好 的
仿 真 , 具 有 符 合 人 类 视 觉 特 性 的特 点 , 能 够 把 人
眼 对 图 像 的 敏 感 度 进 行 量 化
视 觉 嫡 理 论 现 在 还 处 在 发 展 阶 段 虽 然 目
前 还 没 有 精 确 的 方 法 计 算 某 个 图像 区 域 的视 觉
嫡 , 但 是 当 图像 编 码 的 目标 是 高 的感 知 质 量 , 而
不 是 高 的 信 噪 比
时 , 视 觉 嫡 是 一 个 非 常 有 利 的 概 念
或 低 的均 方 误 差
基 于
的 图像 分 割
的 图像 分 割原 理
基 于
信 息 源 一 般 是 一 种 不 确 定 的 情 况 , 当 看 到
一 幅 图 像 时 , 人 类 视 觉 的 不 确 定 性 导 致 人 眼 对
整 个 图像 各 个 部 分 的 注 意 力 存 在 差 别 , 而 视 觉
嫡 可 以 成 为 量 度 这 些 信 息 的 工 具 通 过 对
的研 究 , 有 以下 基 本 结 论
对 于 一 幅 图像 ,
对 于 每 一 个 区 域 的
敏 感 度 是 不 同 的 , 这 主 要 是 由于 区 域 内部 特 性
与 周 围 区 域 的 特 性 存 在 差 异
对 图像 注 意 力 的 分 布 是 参 差 不 齐 、
不 均 匀 的 , 这 决 定 了 人 们 对 图像 视 觉 信 息 的 理
解
对 于 亮 度 的 空 间频 率 变 化 如 纹 理
结 构 其 敏 感 度 要 大 于 相 同 空 间 频 率 的其 他 因
素 的变 化 , 即 人 眼 对 亮 度 的突 变 最 为 敏 感 , 这 些
区 域 往 往 是 图 像 中包 含 信 息 量 最 大 , 对 人 们 的
理 解 最 为 重 要 的 部 分
对 亮 度 突 然 变 化 的 区 域 的 敏 感 度
大 于 亮 度 变 化 慢 或 变 化 小 的 区 域
虽 然 对 图像 中亮 度 变 化 大 的 区 域
比较 敏 感 , 但 对 具 有 规 则 变 化 的 区 域 如 窗 帘或
壁 纸 的 花 纹 , 人 眼 会 产 生 一 种 适 应 性 , 以 至 于
很 容 易 在 人 的 意 识 中遗 忘 , 使 得 人 眼 对 这 种 区
域 的 注 意 力 降低 而 且 普 遍 来 说 这 些 区 域 包 含
的 内容 意 义 并 不 大 , 对 图 像 理 解 不 起 决 定 性 作
用
对 于 一 幅 图像 , 如 果 某 一 区 域 的变 化 是
没 有 规 律 的 , 人 眼 就 会 很 敏 感 如 果 某 一 区 域 的
变 化 规 律 与 周 围 区 域 的 变 化 规律 差 别 很 大 , 就
会 极 大 地 引 起 人 们 对 这 一 区 域 的 兴 趣 ,
对
这 种 区 域 的 敏 感 度 最 高
从 理 论 和 数 学 的 角 度 描 述 至 关 重 要 , 但
的 结 构 机 理 是 很 复 杂
在 观 察 一 幅 图像 时 ,
的 变
的 , 以 至 于 人 们 很 难 掌 握 其 各 个 区 域
化 为 了简 化 研 究 , 我 们 在 对 客 观 进 行 假 设 的情
况 下 , 对 基 于 视 觉 嫡
的 分 割 原 理 作 一 个 原
始 的数 学 描 述【
在 基 于
的 图像 分 割 中 , 只 考 虑 每 个
图 像 区 域 的 内部 特 性 和 相 邻 特 性 , 如 下 式 所 示
了
「价,
, 沪 ,
,
, 势, 分 别 表 示 区 域 , 的 内部 特 性 和
其 中 , 价,
周 围特 性 , 表 示 包 含 ‘ 的 图 像
我 们 认 为 一 幅 图像 中 与
关 系 最 为
紧 密 的 只 有 个 区 域 随 机 纹 理 区 域 和 关 键 点
区 域 随 机 纹 理 区 域 对 于
的理 解 意 义 较 少 ,
而 关 键 点 区 域 却 在 很 大 程 度 上 影 响 了 人 对 图像
的 理 解 , 后 者 的 视 觉 嫡 远 大 于 前 者
基 于
的 图像 分 割算法
基 于 亮 度 空 间 域 变 化 率 的第 一 次 分 割
定 义 对 于 一 幅 图像 的某 个 区 域 , 其 所 有
像 素 亮 度 分 量 的 平 均 值 称 为 该 区 域 的 平 均 亮
度 , 用 变 量 表 示 , 可 以 通 过 下 式 求 得
, 艺
全
其 中 , 表 示 每 个 像 素 的 亮 度 分 量 值 , 表 示 这
个 区 域 中像 素 的 数 量
定 义 一 幅 图 像 中 , 个 相 邻 像 素 亮 度 分
量 的 差 的绝 对 值 称 为 两 个 像 素 间 的 亮 度 变 化 ,
用 变 量 表 示 , 可 以 通 过 下 式 求 得
。 乙一 引
其 中 ,, 乙表 示 个 相 邻 像 素 的亮 度 分 量 值
定 义 对 于 一 幅 图 像 的 某 个 区 域 , 所 有 相
邻 像 素 亮 度 变 化 的总 和 与 该 区 域 中所 含 像 素
总 数 的 比 , 称 为 该 区 域 的 亮 度 变 化 率 , 用 变 量
表 示 , 可 以通 过 下 式 求 得
一 艺 艺 , ,
】一
单 志 广 等 一 种 基 于 视 觉 嫡 的 图 像 分 割 压 缩 方 法
其 中 , 表 示 区 域 中像 素 的数 量 ,
的 个 像 素
, 表 示 相 邻
亮 度 变 化 率 反 映 了 图 像 区 域 内部 亮 度 变
化 的 大 小 和 快 慢 , 计 算 出 每 个 区 域 的 后 , 就 可
以 根 据 设 定 的 闭 值 将 图 像 划 分 成 “ 低 信 息 量
乃 和 “ 高 信 息 量 区 域 ” 争乃 , 并 可 通 过
区 域 ”
调 节 的 大 小 来 改变 图像 的压 缩 比和 压 缩 质 量
图 像 分 割 要 将 图 像 划 分 成 若 干
的 子
块 如 果 取 得 过 大 , 每 次 运 算 所 需 的存 储 空 间
和 运 算 时 间 较 大 但 当 小 到 一 定 程 度 时 , 子 块
之 间 的 边 界 上 可 能 存 在 被 称 为 “ 边 界 效 应 ” 的不
连 续 点 通 过 实 践 可 知 , 当 刀丈 时 , 边 界 效 应 比
较 明 显 , 故 七 要 考 虑 到 后 续 的 处 理 要 采 用
变 换 , 所 以 在 分 割 中 取 这 样 一 幅
的 图 像 被 划 分 为
个 子 块 , 分 别 进 行 处
理
为 了 精 确 的 计 算 每 个
子 块 的 亮 度 变 化
率 , 我 们 提 出 了 一 种 “ 伞 式 算 法 ” 从
子 块
左 上 角 的 第 个 像 素 开 始 , 计 算 与 它 相 邻 的 个
像 素 的 亮 度 变 化 , 然 后 再 以 这 个 像 素 为 起
点 , 依 此 类 推 , 就 可 以计 算 出 这 个 铭 子 块 中所
有 相 邻 像 素 的 亮 度 变 化 其 运 算 的 轨 迹 像 把
打 开 的 伞 , 所 以 称 其 为 伞 式 算 法 如 图 所 示
风 动
又又又又又沐沐
闪闪闪冈冈髯髯
又又
基 于
的第 二 次 分 割 根 据 图像 中 区
域 的 内部 特 征 对 图像 进 行 了 初 次 分 割 后 , 我 们
再 根 据 区 域 间特 性 的 差 异 , 对 图 像 进 一 步 分 割
条 基 于 视 觉 嫡 分
为 了描 述 节 中 ,
块 的
特 性 , 我 们 给 出 以 下 定 义
定 义 一 幅 图 像 中 , 某 一 个 子 块 与 其 所 有
相 邻 子 块 亮 度 变 化 率 差 值 的 均 方 根 , 称 为 该 子
块 的亮 度 平 均 变 化 率 , 用 变 量 ‘表 示 这 里 相 邻
的 子 块 有 个 , 可 以 由下 式 求 得
, 一澹 一
其 中 , 认 , 为 相 邻 个 子 块 的 亮 度 变 化 率
定 义 对 于 一 幅 图像 的 某 个 特 定 区 域 , 其
中 某 一 个 子 块 的亮 度 平 均 变 化 率 , 与 该 区 域
的 平 均 亮 度 , 的 比值 , 称 为 该 子 块 的亮 度 相 对
变 化 率 , 用 变 量 环表 示
厂
一下万一
乙
, 表 示 该 区 域 的 平 均 亮 度 , 表 示 该 区 域
其 中 ,
的 像 素 数 量
子 块 的 亮 度 相 对 变 化 率 反 映 了 该 子 块 与
周 围子 块 在 亮 度 变 化 上 的 差 异 相 对 变 化 率 较
高 的 区 域 对 人 眼 理 解 图 像 意 义 非 常 关 键 , 我 们
把 这 种 区 域 称 为 “ 关 键 点 区 域 ” 相 对 变 化 率 较
低 的 区 域 一 般 为 一 些 相 近 的 纹 理 如 墙 壁 或 桌
布 的 花 纹 , 对 人 类 的 理 解 作 用 不 大 , 我 们 称 为
“ 随 机 纹 理 区 域 ”
基 于
的 分 割 过 程 根 据 视 觉 嫡 分 割
原 理 , 我 们 将 一 幅 图像 划 分 为 部 分 低 信 息 量
区 域 、 随 机 纹 理 区 域 和 关 键 点 区 域 , 然 后 再 进 行
压 缩 分 割 过 程 如 图 所 示
图 计 算 相 邻 像 素 亮度 变 化 的 伞 式 算 法 示 意 图
我 们 以
,
位 真 彩 色 图 像
低信息量
区域
,, 随机纹理理
区区域域
今
高信息量
区域
计 算 每 个
块 的
图 基 于 视 觉嫡 分 割算 法 示 意 图
·
一
单 志 广 等 一 种 基 于 视 觉 嫡 的 图 像 分 割 压 缩 方 法
一
从 压 缩 结 果 可 以看 出 , 采 用 基 于 视 觉 嫡 的 图
像 分 割 压 缩 方 法 重建 后 的 图 像 , 能 够 达 到 很 好
的 主 观 视 觉 效 果 , 尤 其 是 对 人 类 视 觉 系 统 最 为
敏 感 的 区 域 如 眼 部 区 域 对 于 人 类 视 觉 系 统
不 敏 感 的 部 分 , 即 本 文 所 定 义 的 低 信 息 量 区 域
和 随 机 纹 理 区 域 , 也 实 现 了 比 较 好 的 主 观 感 知
效 果
结 束语
基 于 视觉 嫡 的 图像 分 割 原 理 , 提 出 了用 于 量
化 图 像 特 征 的 数 学 定 义 和 基 于 视 觉 嫡 的 分 割 算
法 实 验 结 果 表 明 , 这 种 基 于 视 觉 嫡 的 图像 分 割
压 缩 算 法 是 对 人 的视 觉 系 统 很 好 的 仿 真 , 较 好
地 反 映 了 人 类 视 觉 系 统 的特 性 , 描 述 了 人 眼 对
图 像 不 同 区 域 的 不 同 敏 感 度 , 既 提 高 了压 缩 比 ,
又 保 证 了 压 缩 后 的 重 建 图 像 整 体 上 具 有 高 的主
观 视 觉 感 知 质 量
视 觉 嫡 描 述 了 人 眼 对 信 息 的主 观 量 度 , 具 有
符 合 人 类 视 觉 特 性 的特 点 , 能 够 把 人 眼 对 图像
的 敏 感 度 进 行 量 化 , 是 一 个 很 有 发 展 前 途 的 理
论 但 视 觉 嫡 理 论 还 处 在 发 展 阶 段 , 需 要 对 其 进
行 深 入 的 研 究 和 探 讨 , 主 要 问 题 有
视 觉 嫡 的 数 学 化 描 述 还 不 完 善 , 需 要 对
视 觉 嫡 的 量 化 尺 度 进 行 统 一 的 描 述 , 形 成 一 致
的 评 测 标 准
本 文 在 图像 分 割 中使 用 了 的 固 定 尺 寸 的
子 块 , 导 致 对 于 图 像 中细 节 丰 富 的 区 域 划 分 的
不 够 精 细 , 而 对 于 变 化 平 淡 的 部 分 则 又 显 得 效
率 不 高 , 进 一 步 的 完 善 应 考 虑 使 用 尺 寸 能 够 自
适 应 变 化 的 子 块 , 从 而 提 高 分 割 的 效 率
视 觉 嫡 虽 然 反 映 了
特 性 , 但 是 它
没 有 包 含 人 类 的 理 解 物 体 基
的
方 法 和 基 于 内 容 的 压 缩 编 码 是 当 今 发 展 方 向 ,
因 此 应 该 努 力 将 人 类 对 图像 的 理 解 溶 入 到 视 觉
嫡 理 论 中 , 以 更 好 地 仿 真 人 类 视 觉 系 统 , 并 使 图
像 压 缩 提 高 到 一 个 崭 新 的 水 平
一
参 考 文 献
,
一
,
,
,
,
一
张 正 阳 , 阂 范 保 , 吴 成 柯 基 于 面 部 定位 的 头 肩 像 视 觉
质 量 评 价 方 法 西 安 电子 科 技 大 学 学报 ,
,
,
,
,
魏 涛 基 于 视 觉 嫡 理 论 的 图像 分 块 压 缩 方 法 研 究 学
位 论 文 北 京 北 京科 技 大 学 ,
月只
,
班
,
,
,
一
一
一
一
一