logo资料库

主成分分析的图像压缩与重构.pdf

第1页 / 共3页
第2页 / 共3页
第3页 / 共3页
资料共3页,全文预览结束
DOI:10.14022/j.cnki.dzsjgc.2012.05.041 第 20 卷 Vol.20 第 5 期 No.5 电子设计工程 Electronic Design Engineering 2012 年 3 月 Mar. 2012 主成分分析的图像压缩与重构 (西安工业大学 计算机科学与工程学院, 陕西 西安 710032) 姜 虹 摘要: 针对图像占用空间大 ,特征表示时维数较高等的缺点,系统介绍了主成分分析 (PCA)的基本原理。 提出了利用 PCA 进行图像数据压缩与重建的基本模型。 实验结果表明,利用 PCA 能有效的减少数据的维数 ,进行特征提取 ,实现 图像压缩,同时并根据实际需要重建图像 。 关键词: 图像压缩; PCA; 图像重建; 特征提取 中图分类号 : TP391.41 文章编号:1674-6236(2012)05-0126-03 文献标识码: A Image compression and reconstruction of PCA (School of Computer Science and Engineering, Xi’an Technological University, Xi’an 710032, China) JIANG Hong Abstract: Point to the weakness of space-consuming and higher dimension when featuring the images of the traditional method, the article introduced the basic principles of principal component analysis (PCA), established a basic model of a image data compression in use of PCA. Experimental results show that PCA can effectively reduce the data dimension, implement feature extraction, realize the image compression, and reconstruct image to meet the actual needs. Key words: image compression; Principal Components Analysis; image reconstruction; feature extraction 目前 数 字 图像 的 数 据量 呈 爆 炸型 增 长 ,占 用 大 量 的 存 储 和 传输 等 资 源 ,主 要 是 由于 图 像 数据 中 的 相邻 像 素 的 相 关 性 高 ,图 像 数 据 表 示 中 存 在 着 大 量 的 冗 余 ;与 此 同 时 在 图 像 的 特 征 表 示 的 过 程 中 ,维 数 很 高 ,使 人 难 以 理 解 数 据 之 间 的 关 系,使 得 存 储 、传 输 、处 理变 得 更 加困 难 ,在 处理 、计 算 过 程 中 必 须分 配 很 大的 存 储 空间 以 及 消耗 大 量 的计 算 时 间 ,高 维 数 据处 理 成 了问 题 的 瓶颈 。 压 缩 后的 图 像 传输 到 目 的 地 后 ,要 经过 解 压 缩恢 复 到 原图 像 才 可以 使 用 ,因此 有 必 要 对 压 缩 的 图 像 和 数据 进 行 重构 。 目 前 压 缩 算 法 有 很 多 ,比 如 JPEG[1-2], JPEG2000[3-4],基于小波的相关压缩方法 [5-7]。 文中采用的主成分分析 (PCA)方法能够除去图像 数 据 的 相 关 性 , 将图 像 信 息浓 缩 到 几个 主 要 成分 的 特 征 图 像 中 ,有 效 地 实 现了 图 像 的压 缩 ;同 时可 以 根 据主 成 分 多 少 恢 复 不 同 的数据图像,满足不同层次对图像压缩与重建的需要 。 1 PCA 的基本原理 主 成 分 分 析 (Principal Components Analysis,PCA)是 用 几 个 较 少 的综 合 指 标来 代 替 原来 较 多 的指 标 ,而 这 些 较 少 的 综 合 指 标既 能 尽 多地 反 映 原来 较 多 指标 的 有 用信 息 ,且 相 互 之 间又是无关的。 PCA 的中心目的是将数据空间降维以排除众 多信 息 共存 时 互 相重 叠 的 冗余 信 息 ,是将 原 变 量 进 行 坐 标 变 换,使少数几个新变量是原有诸变量的线性组合 。 同时,这些 新 变 量 要 能 有 效 地 表 示 原 变 量 表 达 的 数 据 结 构 而 不 丢 失 或 尽量少丢失信息,且新变量互不相关。 通过 PCA 处 理的 图 像 信息往往能够保留住更多的数据的最重要方面 。 主 成 分 分 析 的 基 本 原 理 是 选 择 样 本 点 分 布 方 差 大 的 坐 标轴 进 行 投影 ,使 维 数降 低 而 信息 量 损 失最 小 。 给 定 数 据 矩 阵 Xm×n (通 常 m>n),它 由 一 些 中 心 化 的 样 本 数 据{xi} m 构 成 , 其中 xi∈Rn 且: i=1 m Σxi=0 i=1 (1) 原图像数据 A 如果没有经过 中 心 化 ,即 式 (1)不 成 立 ,则 应对数据 A 进行标准化处理。 即对每一个指标分量作标准化 处理,即: Xij= Aij-A軍j Sj 其中样本均值和样本标准差: A軍j= 1 m m ΣAij Sj= i=1 1 m-1 m Σ(Aij-A軍j)2 i=1 姨 得到 X=(xij)m×n。 PCA 通过式(2)将输入数据矢量 xi 变换为新的矢量 (2) (3) 收稿日期:2011-12-29 C= 1 基金项目:西安工业大学校长基金(XGYXJJ0529) n 作者简介:姜 虹(1977—),女,陕西西安人,硕士,讲师。 研究方向:软件工程、智能信息处理。 稿件编号:201112158 -126- n Σxi xT i i=1 si=UTxi 其中:U 是一个 n×n 正交矩阵,它的第 i 列 Ui 差矩阵的第 i 个本征矢量。 (4) 是样本协方 (5)
姜 虹 主成分分析的图像压缩与重构 换句话说,PCA 求解如下的本征问题: 由式(10)计算样本矩阵的相关系数矩阵: λi ui=Cui i=1,…,n 其中 λ 是 C 的 一 个 本 征 值 ,ui (6) 是 相 应 的 本 征 矢 量 。 当 仅 利用前面的 P 个本征矢量时 (对应本征值按降序排 列 ),PCA 变换可以表示为 : S=UTX (7) 其中 S 称 为主 分 量 ,最大 特 征 值 λ 对 应 的 最大 特 征 向 量 μ 就是第一个主成分 , 这个特征向量就是数 据 有最 大 方 差分 布 的 方 向 。 第 二 主 成 分 也 就 是 第 二 大 特 征 值 对 应 的 特 征 向 量 ,数 据 点 沿 着 这 个 方 向 方 差 有 第 二 大 变 化 ,且 这 个 特 征 向 量与第一个是正交的 。 PCA 变 换 矩 阵 U 是 按 特 征 值 λ 大 小 排 列 的 相 应 特 征 向 量 u 组 成 的 变换 核 矩 阵 ,由 于 能 量主 要 集 中于 特 征 值 λ 大 的 系数中,如果只用特征值较大的前 k(k<(n×n))个主分 量来 近 似表示 S,即丢掉对应于特征值 λ 较小的系数,则对图像质量 不会有大的影响 。 即用前 k 个最大的特征值对应的 k 个特征 向量构成新的变换矩阵 Uk 做一新的变换。 Sk=Uk X,其中 Uk = 2 uT … uT uT 1 k k×n×n (8) 可 由 k 维 向 量 Sk(称 为 主 分 量 )代 替 原 来 的 n×n 维 向 量 S。 式(8)就称为图像的主分量表示 。 这就是标准的 PCA,这种 标准 化 方法 有 效 地减 少 了 数据 量 纲 对数 据 提 取 的 影 响 ,它 广 泛应用于图像特征选择和表示 、图像数据压缩等方面 。 2 主成分分析的图像重建 主 成 分 分 析 中 主 分 量 Sk 相 对 于 S 其 维 数 减 少 了 n×n-k 维,作反变换得到原图像 A 的降维重建值A赞 : A赞 =U T k Sk (9) 由于上式重建图像只能叫做原图像 A 的估值A赞 , 也必然 存在误差。 A 和A赞 之间的均方差误差是: n×n k n×n ems= Σλi- i=1 Σλi= i=1 Σλi i=k+1 (10) 上式表明,如果 k=n×n(即所有的特征向量都用于变换 ), 则误差为零。 而如果选用 k 个具有最大特征值得特征向量组 成变换矩阵 Uk,则从图像的降维重建 和 均 方 差 误 差 降 至 最 小 来说,PCA 变换是最佳的。 主成分变换的运算是求输入矢量构成的协方差矩阵的特 征值与特征矢量。 将所获得的 n 个指标(每一指标 有 m 个 样 品)的一批数据表示成 m×n 维数据矩阵: A= 埙 a11 … a1n … 埙 … am1 … amn 埙 (11) 对矩阵 A 作标准化处理,即对 每 一 个 指 标 分 量 进 行 标 准 化处理,利用公式(2),从而得到矩阵 X=(xij)m×n。 R= 1 m-1 XT·X=(rij)n×n (12) n 并对特征向量进行相应调整得 v ′ 运用 Jacobi 迭代方法计算 R 的特征值 λ1,…,λn,即对应的 特征向量 v1,…,vn,特征值按降序排序(通过选择排序)得 λ ′ 1 ≥ n 。 通过施密特 …≥λ ′ 正交化方法单位正交化特征向量,得到 α1,…,αn。 计算特征值 的累积贡献率 B1,…,Bn,根据给定的 提 取 效 率 p,如 果 Bt≥p, 则提取 t 个主成分 α1,…,αt。 计算已标 准 化 的 样 本 数 据 X 在 提取出的特征向量上的投影 Y=X·α,其中 α=(α1,…,αt)。 所得 的 Y 即为进行特征提取后的数据也就是数据降维后的数据。 1 ,… ,v ′ 由式(12)可得重建图像X赞 ,反变换公式如下: X赞 =XTY (13) 3 实验结果 PCA 并 非 针 对 单 一 样 本 ,对 于 一 副 图 像 而 言 ,可 以 将 图 像分割成 很 多 块 (image patches),将 这 些 小 图 像 块 作 为 样 本 , 并且假设这些样本有着共同的成分。 将一副图像分割成许多 小图,并假设这些图有着相关性,且这些假设在大部分情况下 都 成 立 ,图 3 使 用 图 flower.jpg 图 ,大 小 为 576×576。 分 割 成 12×12 的 块 ,共 有 576 个 样 本 ,经 PCA 运 算 后 ,取 前 48 个 主 分量画出其特征分布图,如图 1 所示;并由得出的主成分特征 矩阵求出不同特征数下特征累计贡献率的变化趋势图 , 如图 2 所示;由此看出,伴随着特征数的增加其累积贡献率也随 着 增加,当特征数增加到一定数量后,特征数量的增加对累计贡 献率和图像重建效果的影响不是很大。 图 1 前 48 个主分量的分布图 Fig. 1 The distribution of the prior 48 principal components 图 2 特征累计贡献率图 Fig. 2 The cumulative contribution rate chart of these features -127-
《电子设计工程》2012 年第 5 期 根据运算特出的主分量, 分别取前 k 个不同的主分量得 到不同的重建图像,如图 3 所示。 图 3 不同主成分条件下图像的重建 Fig. 3 Image reconstruction of different principal components 4 结 论 PCA 能有 效 地减 少 数 据的 维 数 ,并能 使 提 取 成 分 与 原 始 数 据 的误 差 达 到均 方 最 小 ,可 用 于 用于 数 据 的压 缩 和 模 式 识 别 的 特 征 提 取 。 特 别 是 随 着 多 媒 体 图 像 数 据 信 息 技 术 的 发 展 ,丰 富 的 图 像 媒 体 蕴 藏 着 大 量 的 信 息 ,为 了 有 效 地 存 储 和 传 输这 些 图 像数 据 ,图 像压 缩 技 术越 来 越 受到 重 视 。 文 中 提 出 的 基 于 PCA 的 图 像 压 缩 与 重 建 ,经 试 验 结 果 表 明 ,实 现 方 法 简 单 ,能 有 效 地 实 现 图 像 的 压 缩 ;同 时 可 以 根 据 主 成 分 多 少 恢 复 不同 的 数 据图 像 ,满 足不 同 层 次对 图 像 压 缩 与 重 建 的 需要。 参考文献: [1] 张元 伟 ,刘彦 隆.基 于JPEG 标 准 的 静态 图 像 压缩 算 法 研究 [J].电子设计工程,2010,18(2):78-80. ZHANG Yuan-wei,LIU Yan-long. Research of static image compression algorithm based on JPEG standard[J]. Electronic Design Engineering,2010,18(2):78-80. [2] 郑崴 ,苗 青林. 图 像 压 缩 技 术JPEG 的 分 析[J]. 河 南 科 技 学 院学报,2010,38(3):123-126. ZHENG Wei,MIAO Qing-lin. Analysis of JPEG of image compression technology [J]. Journal of Henan Institute of Science and Technology,2010,38(3):123-126. [3] 吴 涛 ,毕 笃 彦. JPEG2000图 像 压 缩 算 法 研 究 [J]. 计 算 机 应 用与软件,2007,24(9):155-156. WU Tao,BI Du-yan. Study of wavelet based JPEG2000 image compression algorithm [J]. Computer Applications and Software,2007,24(9):155-156. [4] Christopoulos C,Skodr as A,Ebrahimi T. The JPEG2000 still image coding system: an over view [J]. IEEE Transactions on Consumer Electronics,2000,46(4):1103- 1127. [5] 尚 晓 清 ,宋 国 乡 ,徐 发 国. 基 于 小 波 变 换 的 简 单 变 长 编 码 图像压缩方法 [J] . 西 安 电 子科 技 大 学学 报 ,2002,29(1): 96-99. SHANG Xiao-qing,SONG Guo-xiang,XU Fa-guo. A new SVLC scheme for image compressing based on wavelet trans- form[J]. Journal of Xidian University,2002,29(1):96-99. [6] Eslami R, Radha H. Wavelet-based contourlet transform and its application to image coding[C]//Proceeding of IEEE Inter - national Conference on Image Processing ,Singapore: IEEE, 2004:3189-3192. [7] Eslami R, Radha H. New image transform using hybrid wavelets and directional filter banks: analysis and design [C]// Proceeding of IEEE Inter national Conference on Image Processing. [s.l.]: IEEE,2005:733-736. !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! TriQuint 推出应用于 3G 和 4G 智能手机的最小尺寸的功率放大器解决方案 TRITIUM DUOTM 技术 创 新的 射 频 解决 方 案 领导 厂 商 TriQuint 半导 体 公 司 (纳 斯 达 克代 码 :TQNT)今 天 宣 布 ,推 出 业 内 最 小 针 对 3 G 和 4 G 智能手机的双频带功放双工器(PAD)— —— TRITIUM DuoTM。 该新型 TRITIUM DuoTM 系列在单一紧凑模块中 结合 了 两 个特 定 频 带的功率放大器 (PA)和双工器,有效地替代了多达 12 个分立器件。 TriQuint 中 国 区 总 经 理 熊 挺 表 示 : “ 我 们 已 经 用 超 过 五 亿 个 的 单 频 带 TRITIUMTM 模 块 服 务 全 球 顶 级 智 能 手 机 , 现 在 TRITIUM DuoTM 系列已经被客户们认可并采用到下一代智能手机 。 我们广泛的技术组合使我们能够在一个小占位面积中集成 两个常用频带 。 我们不仅为手机设计师们简化了射频前端,同时还提高了性能和灵活性。 ” TRITIUM Duo 系列所有产品的占位面积均为 6×4.5 mm,为 设 计师 提 供 在横 跨 多 个平 台 上 支持 多 频 带 、多 模 式 操作 的 灵 活 性。 移动设备制造商能够凭借采用我们产品所带来的占位面积极大缩小的优势 ,在节省出来的更多电路板空 间 中 可添 加 更 多 功能和特性 ,或者将电池做得更大 ,确保更薄更轻,且包含所有 CDMA、3 G 和 4 G 网络所需要的性能 。 咨询编号:2012051012 -128-
分享到:
收藏