logo资料库

基于内容的医学图像检索技术.pdf

第1页 / 共10页
第2页 / 共10页
第3页 / 共10页
第4页 / 共10页
第5页 / 共10页
第6页 / 共10页
第7页 / 共10页
第8页 / 共10页
资料共10页,剩余部分请下载后查看
2 2 第 22 卷第 4 期 2010 年 4 月 计算机辅助设计与图形学学报 Journal of Comp uter Aided Design & Computer Graphics Vol. 22 No . 4 Ap r. 2010   基于内容的医学图像检索技术 , 李敏丹1) 沈  晔1 ,2) 1) (中国计量学院信号与信息处理系  杭州  310018) 2) (浙江大学生物医学工程与仪器科学学院教育部生物医学工程重点实验室  杭州  310027) , 夏顺仁2) ( shenye1978 @vip . sina. com) 摘 要 : 建立一个高效 、准确的医学图像检索系统是目前具有挑战性的任务. 文中在简述基于内容的医学图像检索 模型后 ,着重探讨和分析了检索模型中图像特征提取 、特征选择与融合 、相似度匹配 、图像预过滤 、相关反馈等核心 技术和相关算法 ,以及一些最新的应用. 最后对基于内容的医学图像检索技术进行了展望. 关键词 : 基于内容的医学图像检索 ;特征提取 ;相似度匹配 ;语义鸿沟 ;相关反馈 中图法分类号 : TP391. 41 A Survey on Content Based Medical Image Retrieval Shen Ye1 ,2) , Li Mindan1) 1) ( De part ment of S i gnal an d I nf ormation Processi n g , Chi na J ili an g Uni versit y , H an gz hou  310018) 2) ( T he Key L aboratory of B iome dical En gi neeri ng of M i nist ry of Ed ucation , Col le ge of B iome dical En gi neeri ng an d I nst rument S cience , , and Xia Shunren2) Zhej i ang Uni versit y , H an gz hou  310027) Abstract : It is a challenging task to build an efficient and effective ret rieval system for medical images. based medical image ret rieval (CBM IR) techniques is p resented in A co mp rehensive survey of co ntent t his paper. After a brief int roduction of t he CBM IR model , five related key techniques such as image feat ure ext raction , feat ure selection and f usio n , similarit y matching , image p refiltering and relevance feedback , are deeply analyzed. Some latest applications are also discussed. Finally , some p romising research directions about CBM IR are suggested. Key words : content gap ; relevance feedback based medical image ret rieval ; feat ure ext ractio n ; similarit y matching ; semantic   随着医学成像技术的发展和医院信息网络的普 及 ,医院每天会产生大量的包含病人生理 、病理和 解剖信息的医学图像 ,这些图像是医生进行临床诊 断 、病情跟踪 、手术计划 、预后研究 、鉴别诊断的重要 依据. 传统的医学图像检索方法是基于关键字来检 索图像 ,但其人工标注具有很强的主观性 ,并且文本 难以完全表达图像所包含的丰富的语义内容. 基于 内容的医学图像检索 (content based medical image ret rieval ,CBM IR) [ 1 ] 是从医学图像本身提取灰度 、 形状 、纹理 、拓扑等底层视觉特征和高层语义特征 , 构成描述图像内容的特征向量 ,并以特征向量作为 建立索引和匹配准则的客观依据检索所需图像. 近 年来 ,CBM IR 技术已成为生物医学工程领域十分活 跃的研究方向. 目前 ,CBM IR 采用的技术多半来自基于内容的 based image ret rieval , CB IR) , 图像检索 ( co ntent 收稿日期 :2009 - 02 - 22 ;修回日期 :2009 - 12 - 23. 基金项目 :国家自然科学基金 (60772092) . 沈  晔 (1978 —) ,男 ,博士研究生 ,讲师 ,主要研 究方向为医学图像理解、基于内容的图像检索、计算机辅助诊断 ;李敏丹 (1976 —) ,女 ,硕士 ,讲师 ,主要研究方向为图像处理、机器学习、基于内 容的信息检索 ;夏顺仁 (1965 —) ,男 ,博士 ,教授 ,博士生导师 ,主要研究方向为生物医学成像与图像处理、计算机辅助医学影像诊断技术 、认知 科学. © 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
Π 075 计算机辅助设计与图形学学报       第 22 卷 但 CB IR 中 的 许 多 成 熟 技 术 并 不 能 直 接 移 植 到 CBM IR 中 ,这主要是由医学图像本身的特点决定 的 :1) 大多数医学图像是灰度图 ,不同的图像内容可 能灰度信息相似 ,这使得常规的基于图像全局特征 (如灰度直方图) 的 CB IR 算法不适用于医学图像 ; 2) 自然图像往往含有可以区分类别的背景色彩 ,然 而医学图像 (如 X 线图像) 的背景都为黑色 ,图像类 别的区分仅依靠对图像中对象的分类来完成 ;3) 医 学上存在多种成像模式 ,针对不同模式的图像处理 算法也会有所不同 ,提取的特征也有差异 ;4) 图像处 理技术在医学图像处理领域还面临着很多困难 ,如 医学图像分割等 ;5) 医学成像过程中会引入各种噪 声 、伪影 、几何形变等干扰 ;6) 医学图像灰度分辨率 和空间分辨率高 ,所含信息量大. 因此 ,必须寻求适 合医学图像特点的特征提取算法和内容表示方法 , 才能使 CBM IR 获得成功. 在一个典型的 CBM IR 系统中 ,通过提取待检 索图像和图像库中目标图像中的底层视觉特征 (如 颜色 、纹理或形状等) 形成特征向量 ;然后选择合适 的相似度匹配技术来实现待检索图像与图像库中目 标图像的匹配 ,返回相似度最高的前 N 幅图像作为 系统初步的检索结果. 但是 ,2 幅底层特征相似度匹 配程度高的图像在语义内容上可以相差很大 ,存在 着所谓的“语义鸿沟”[ 2 ] ,它是制约基于图像底层特 征的 CBMIR 性能的主要原因. 如何解决“语义鸿 沟”是目前 CBM IR 研究中最活跃的问题之一. 目前 缩减“语义鸿沟”的技术主要有 : 基于区域的图像 检索 、基于机器学习技术的图像语义分类 、相关反馈 (relevance feedback , RF) [ 3 ] 、自适应相似度匹配函 数 、结合文本的 CBM IR 等 ,其中 RF 技术应用最为 广泛且效果显著. 本文对 CBM IR 系统中的特征提取 、特征优化 与融合 、相似度匹配 、RF 等核心技术和算法进行详 尽的综述和分析. 最后对 CBM IR 进行了展望. 1  特征提取 广义地讲 ,图像特征包括文本特征和视觉特征. CB IR 中主要考虑视觉特征 ,它又有通用特征和领 域相关特征之分. 前者用于描述所有图像共有的特 征 ,与图像的具体类型和内容无关 ,主要包括颜色 、 纹理等 ;后者则建立在对所描述图像内容的某些先 验知识的基础上 ,与具体的应用紧密相关. 另外 ,根 据特征对图像的描述程度可以把特征分为全局特 征 、布局特征和语义特征等. 1. 1  颜色特征 颜色特征是 CB IR 中应用最为广泛的视觉特 征. 与其他的视觉特征相比 ,颜色特征对图像本身的 尺寸 、方向 、视角的依赖性较小 ,具有较高的鲁棒性. 由于 HSV ,CIELlab 和 L uv 等颜色空间更接近于人 们对颜色的主观感受 ,因此它们常被应用于 CB IR 中. 目前常用的颜色特征表示方法有直方图法 、累积 直方图法 、颜色聚类法 、颜色矩法 、颜色集和颜色相 关图等. 其中灰度直方图的表示方式由于运算简单 , 具有平移 、旋转和缩放不变性 ,被大部分 CBM IR 所 采用. 对于医学图像而言 ,查全率很重要 ,采用灰度 直方图可以保证检索的结果是所需结果的超集. 医学图像中的病灶是高度局部化的 ,采用全局 图像特征 ,如颜色直方图 、纹理特征等无法表达图像 中的病灶信息. 为了达到更好的检索性能 ,就需要考 虑图像中局部的 、区域的信息 ,构造出布局特征. 提 取布局特征最简单的方法是把图像分为固定大小的 子块 ,再从每个子块提取特征. 这些图像子块并不包 含图像的语义内容 ,但可以通过用户选择图像子块 来描述图像中的目标对象 ,该方法对图像中病人的 成像位置相当敏感. 另一类方法是基于聚类的区域 特征提取方法. 文献 [ 4 ] 基于混合高斯模型 , 采用 EM 算法完成了图像区域的聚类 ,每个区域包含不 同的语义信息. 最理想的布局特征提取是将图像分 割为单独的对象 ,再提取它们的底层特征 ,并结合空 间信息用于检索 ,但目前对医学图像的自动分割还 很难实现. 在医学应用领域 ,纹理和形状等特征相比 颜色和灰度特征来说能更好地描述图像的内容. 1. 2  纹理特征 纹理特征反映图像像素灰度或颜色的某种规律 性变化 ,是医学图像检索应用中的重要特征之一. 目 前 ,纹理特征提取的方法有统计法 、结构法 、模型法 和空间 频域联合分析法等. 统计法是对像素的空间 分布信息进行统计 ,包括共生矩阵法 、Laws 纹理能 量法 、Tamura 法 、空间自相关法等 ,其中从灰度共 生矩阵中提取纹理特征是目前最常用且有效的方 法 ;结构法主要是分析纹理基元的分布规则 ;模型法 先假设出纹理分布模型 ,如随机场模型 、分形模型 等 ,再由图像确定出模型参数 ,即纹理特征 ;空间 频 域联合分析常用的方法有傅里叶变换法 、小波变换 法和 Gabor 滤波法等. 大量生理研究表明 , Gabor 函 数能够很好地模拟人类视觉感受 ,最佳地描述时频 © 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
2 沈  晔 ,等 :基于内容的医学图像检索技术 第 4 期 175 域的局部特性. 以往在 CBMIR 中常用的纹理提取方 法主要有基于灰度共生矩阵的特征提取[5 ] 、Gabor 滤 波法[ 6 ] 、小波变换法[ 6 ] 和马尔科夫场的纹理特征[ 7 ] 等. 医学成像过程引入的各种噪声影响到图像的纹 理特性时 ,形状特征将是更有效的图像描述方法. 1. 3  形状特征 形状特征首先是通过边缘检测和区域分割等形 状分割技术提取出目标对象的轮廓与区域 ,进而从 轮廓与区域中得到形状特征. 与颜色和纹理相比 ,形 状特征包含了图像的更多语义内容. 有效的图像分割技术对于 CBM IR 系统而言至 关重要 ,因为医学图像所提供的病理信息往往局限 于图像中的局部区域 ,图像分割的目的就是识别这 些局部区域 ,以利于提取具有临床诊断意义的局部 特征. 与其他类型的图像分割相比 ,医学图像分割方 法在很大程度上依赖于特定的图像 、成像方式以及 其他因素. 例如 ,对脑组织分割的要求就不同于对肝 脏的要求 ,MRI 有异于超声波图像. 由于医学成像 过程中引入的噪声和干扰也会在很大程度上影响后 续的分割 ,所以至今没有一种适用于任何医学图像 的通用的分割技术. 在 CBM IR 中 ,当应用分割技术 得不到理想效果时 ,常常通过学习技术从训练图像 中学习到图像的高层语义. 目前 ,对医学图像的分割技术可以分为阈值法 、 边缘检测 、区域分割 (区域的分裂和合并) 和混合方 法等 4 类. 其中阈值的选择是阈值分割技术中的关 键技术 ,通常采用交互式的方法确定阈值. 基于边界 的图像分割技术通过边缘检测技术 , 如 Canny 算 子 、So bel 算子等来定位不同区域的轮廓 ,该技术对 图像中的噪声比较敏感. Canny 算子经常被应用于 医学图像检索[ 8 ] 中完成边缘检测 ,它对白噪声影响 的阶跃型边缘检测是最优的. 区域分割技术的成败 直接取决于像素合并准则的选择 ,该准则主要由图 像本身特性及与用户交互来决定 ;并且大部分区域 分割算法对起始点的位置选择也相当敏感. 基于区 域生长的分割技术是最常用且有效的医学图像分割 技术 ,针对不同的分割任务有多种改进的算法. 文 献[ 9 ]对心脏病 、乳腺癌 、前列腺癌 、血管疾病等临床 应用中的超声波图像的分割技术进行了详尽的综 述. 现实中 ,病灶特征往往只存在于部分形状 ,采用 整个形状特征匹配反而会降低病灶特征的区分度 , 影响检索的准确性. 文献 [ 10 ]采用了一种基于动态 规划的部分形状匹配技术实现脊椎 X 线图像检索 任务 ,实验结果也验证了与完整形状匹配相比 ,部分 形状匹配有更好的查准率. 形状特征常用的表示方法有傅里叶描述子 、多 边形近似 、不变矩 、Hough 变换方法等. 其中不变矩 和傅里叶变换的轮廓描述符由于具有位移 、旋转和 缩放不变的良好性质 ,常应用于 CBM IR 系统[ 11 ] 中. 另外 ,文献[ 12 ]中用形态谱和形态学的特征来描述 肿瘤的形状特征. 1. 4  语义特征 颜色 、纹理 、形状等视觉特征常被称为底层视觉 特征 ,它们缺乏图像的语义信息. 如何得到图像的高 层语义特征是学者们共同关注的研究热点. 文本是图像高层语义存在的普遍形式 ,基于文 本特征与图像视觉特征相结合的方法越来越多地被 用来减 少 系 统 的“语 义 鸿 沟”. 文 献 [ 13 ] 中 利 用 DICOM 头文件中的文本信息 ,找出与查询图像类 别一致的图像集合 ,并在该图像集合中完成图像检 索. 该方法使检索的范围大大缩小 ,提高了执行效率 和检索的准确性. 但图像的文本注释不仅耗时且有 很强的主观性 ,注释规范的不统一至今也未得到很 好的解决. 文献[ 14 ]通过定义一个客观的医学图像 注释术语和规范来进行医学图像的语义注释 ,以克 服自由文本表达语义不准确 、多义性等缺点 ,并实现 了文本的语言无关性. 但该方法尚不成熟 ,许多技术 环节还需解决 ,如建立一个完备的 、准确的 、无歧义 的医学专业知识库 ,从文本的上下文中自动提取高 层语义概念的方法等. 基于本体的图像检索是利用图像注释进行语义 检索的最终目标. 本体是以结构化的形式无歧义地 表达图像的语义内容 ,该结构能被机器所理解. 具体 地 ,针对具体应用的领域 ,定义一个被广泛接受 、一 致的术语集来描述图像中所包含的视觉对象和其对 应的概念 ,以及严格的语法规范来描述概念间的相 互关系. 借助于本体构建工具 ,如 Protégé 2000 ,采 用标准本体描述语言 ,如 XML , RDF 和 OWL 等完 成图像本体的构建. Hu 等[ 15 ] 首次将本体应用于 CBM IR 中 ,系统采用 DL 完成了乳腺图像的本体构 建 ,并以该图像本体进行语义检索. 本体结构具有良 好的推理能力 ,尽管 2 幅图像的视觉特征相差很大 , 包含相同概念的图像都将被检索到. 文献 [ 16 ]是本 体在 CBM IR 中的最新应用 ,其中考虑到了在不同 的上下文环境下图像注释的内容和重点会不同 ,得 到的本体结构也将不同的特点 ;将通过反馈得到的 图像上下文信息作为图像注释的约束条件 ,构建出 符合当前上下文环境的本体结构 ,更加准确地表达 © 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
2 275 计算机辅助设计与图形学学报       第 22 卷 了图像的语义内容. 此外 ,该文实现了本体实例转换 DICOM , HL7 和 OWL 等语言形式 ,尝试医院和网 络跨平台的语义整合 ,这是今后很有意义的研究方 向. 本体的构建工具也日趋成熟 ,但支持的仍然是手 工构建的方式 ,用户依然需要逐个输入和编辑每个 概念的名字 、约束 、属性等内容 ,因此如何利用知识 获取技术来降低本体构建开销是一个很有意义的研 究方向. 另外一类常用的语义特征提取方法是利用机器 学习方法的图像分类技术[ 2 ] ,它通过学习得到的分 类器将查询图像分类到对应的语义类别来描述图像 中所含的语义内容. 该方法在 RF 技术中常被用来 减少“语义鸿沟”. 基于文本注释的方法是目前最有 效的语义描述方法 ,但需要大量重复的人工劳动. 基 于机器学习的方法由机器自动进行 ,摆脱了对人力 的依赖 ,成为 CBM IR 中的研究热点. 2  特征融合和选择 颜色 、纹理和形状特征都只反映了图像某方面 的特征. 由于采用单一特征无法覆盖多特征矢量 ,得 不到理想的检索结果 ,所以需要融合多个特征来描 述图像 ,并根据用户感兴趣的因素调节各特征权重 来实现有效的检索. Howart h 等[ 17 ] 提出了将纹理和 颜色等特征进行融合的方法 ,在一定程度上提高了 检索性能 ,但其认为每个特征具有相同的重要性 ,仅 仅对多个特征作简单的平均加权 ,没有分析各个特 征对检索性能的影响 ,系统性能的改善不明显. 在特 征融合中 ,关键问题是如何评价各个特征对检索性 能的作用程度 ,并根据作用程度的大小来对各特征 权重赋值. 通过 RF 过程中的用户反馈信息学习各 特征的重要性 ,得出相应的权重值是目前常用的有 效技术. Xia 等[ 18 19 ] 在内窥镜图像的检索应用中提 出了结合 RF 的特征融合技术 ,通过对基于单个特 征得到的检索结果进行 RF 得出各特征的权值大 小. 实验结果表明 ,结合 RF 进行特征选择是目前最 有希望的特征选择方法. 多特征融合得到的特征向量往往达到成百上千 维 ,高维数的特征向量会引起以下问题 :分析耗时 , 检索效率降低 ;许多特征之间是相互关联的 ,特征数 量的增加相反会降低检索性能. Beyer 已经证明了 特征数量的增加会使每个特征的重要性降低. 再者 , 大量的特征会使 CB IR 面临“维数灾”问题[ 20 ] . 因此 实际应用中需要对特征向量进行降维 ,目前主要的降 维算法是主分量分析 (principal component analysis , PCA) [ 2 ] 和线性判别分析 (linear discriminant analysis , LDA) . PCA 是一种无监督的降维技术 ,在 CBM IR 中被广泛采用. 文献[ 2 ]中采用 PCA 技术 ,将融合颜 色 、纹理和边缘特征的 101 维查询向量降维到 6 维 的特征空间 ,实验证明 ,6 个主分量成分占整个特征 空间的 99. 916 % ,而检索的效率大大提高. 但是 , PCA 保留的是最能描述样本分布的特征 ,而不是最 有利检索的特征 ,所以今后可以考虑将 PCA 方法与 特征对检索的作用相结合来改善效果. 与 PCA 不 同 ,LDA 是一种监督降维技术 ,它通过变换使类间 离散度与类内离散度之比最大 ,也就是使不同类别 尽可能分开 ,相同类别尽可能聚类. PCA 与 LDA 都属于线性降维方法 ,然而大部 分现实世界的数据都是非线性的 ,非线性降维技术 近年得到了学者们的重视. 常用的非线性方法是将 PCA 与 LDA 技术通过核技术进行非线性推广得 到. 例如 KPCA[21 ] 是 PCA 的非线性推广 ,它通过核技 术将非线性数据映射到高维的线性特征空间 ,然后在 该线性空间进行 PCA 降维. 由于流形学习算法[22 ] 旨 在获得非线性分布数据内在结构的特点 ,近年来被用 来处理非线性的降维问题 ,如 ARE[23 ] . 与 PCA 和 LDA 等传统的降维方法仅关注全局欧氏空间结构不 同 ,流形学习用来发现局部的流形结构 ,更适合图像 检索. 文献[ 24 ]提出一种新的基于流形学习的半监 督降维算法 MM P ( maximum margin p rojectio n) , 使每个样本局部邻域的正例和负例样本之间的间隔 最大. MM P 算法通过对标记样本与未标记样本定 义不同的目标函数 ,赋予标记样本更高的权值 ,克服 了 A R E 算法中对这 2 种样本相同权值的缺点 ,表 现出了比 A RE 算法更好的性能. 3  相似度匹配 特征向量间的欧氏距离 、Minkowski 等距离由 于实现简单 、概念清晰常用于度量图像的相似度 ,但 该几何相似度模型与人的视觉感知并不相符. 在基 于布局特征的检索系统中 ,图像间的相似度匹配基 于单个区域间的相似度比较之上 ,对整幅图像的查 询通过融合单个区域的检索结果来进行. 文献 [ 25 ] 中提出了综合区域匹配机制来结合图像中全部区域 的特征进行相似性度量 ,减小了不准确分割造成的 影响. © 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第 4 期 沈  晔 ,等 :基于内容的医学图像检索技术 375 基于概率模型的统计匹配技术是另外一类相似度 匹配方法. 常用的统计距离度量方法有 Bhattacharyya 距离和 KL 距离[ 6 ] 等. 文献[ 2 ]采用统计距离测量技 术 ,在假定语义类别中图像特征为高斯分布的前提 下 ,基于 Bhattacharyya 距离得到 2 幅图像间相似 度. 语义类别符合假设的概率分布时 ,统计的相似度 匹配技术更能反映图像间的语义相关性. 另一类是 基于学习的匹配技术 ,它利用已知的病例图像进行训 练、学习 ,并对未知图像进行分类. 目前用于 CBMIR 中的学习技术有支持向量机 (support vector machines , SVM) 和神经网络等. 基于学习技术从训练样本中 学习语义信息 ,匹配结果更符合人的主观感知 ;但其 匹配结果受训练样本的数量 、学习方法的选择等因 素影响. 进一步研究人机交互的方法 ,学习人的主观 相似度感受 ,进而建立符合人眼的相似计算度模型 是需要继续研究的难点. 4  图像预过滤 对大量图像进行特征提取和相似度匹配的计算 量相当大 ,会影响 CBM IR 系统的实时性 ,因此有必 要在相似度匹配之前引入一个预先过滤过程 ,并通 过该过程 ,从被检索图像库中找出与查询图像类型 一致的图像子集. 后续的检索过程将在该图像子集 中进行 ,图像预先过滤有以下 3 个优点 :1) 减少了图 像检索的范围 ,提高了系统的效率 ;2) 减少了系统返 回不相关结果的可能性 ,提高了系统的准确性 ;3) 对 于不同类别的图像往往采用特定的检索技术 ,已知 该图像类别的先验知识可以提高系统检索性能. 文献[ 26 ]利用 DICOM 头文件包含图像类别 、 解剖部位 、病人姓名等的文本信息进行基于文本的 信息检索 ,找出与查询图像类别或检查部位相符的图 像子集 ,再进行 CBIR ,提高了系统的性能. 文献[ 2 ]同 时利用 SVM 和 FCM 算法来共同确定与查询图像相 关的图像子集 ,它对图像库中每幅图像 ,应用 SVM 与 FCM 分别得到该图像与查询图像的相关概率 ; 然后将 2 个相关概率相乘得到一个联合概率 ,通过 联合概率的大小对图像库中图像进行排序 ,过滤与 查询图像不相关的图像. 其中 SVM 找出与查询图 像语义相关的图像 ,而 FCM 得到与查询图像自然 聚类的相关图像 ,这 2 种互补的分类技术使该滤波 算法更有效 ,代表了当前图像预过滤的最新技术. 5  RF 技术 20 世纪 90 年代中期 ,文本检索领域提出的 RF 技术被引入到 CB IR 中 ,用于减少“语义鸿沟”. 由于 图像与文本相比更具主观多义性 ,在图像检索中采 用 RF 是非常必要的. 在 RF 的交互过程中 ,用户对系统返回的检索 结果给出相关程度的判断 ,系统根据用户的反馈信 息进行学习 ,通过改变特征空间 、优化相似度的匹配 公式或更新学习机等方法使得检索结果更符合用户 的主观感受 ,提高系统的语义检索能力. 本文根据采 用的检索模型把 RF 算法分为基于距离度量的模型、 基于概率统计分类的模型和基于机器学习的模型. 5. 1  基于距离度量的模型 在该检索模型下 , RF 算法的主要策略是优化 查询矢量 、优化相似度度量公式和特征空间变换. 优化查询矢量也被称为查询点移动 (query point movement ,Q PM) ,将在反馈中计算正例样本的中 心点作为新的查询. 但该方法只有正例样本为单一 分布时才有较好的效果 ,未利用负例样本. 相似度度量公式优化也被称为权值调整. 权值 调整的原则是加强能使反馈中的正例样本聚拢并能 将正例样本和负例样本有效分开的特征分量 ,否则 减弱该特征分量. 文献[ 27 ]将所有正例样本在各特 征分量上的标准方差的倒数作为该分量的权值 ,其 同样是基于正例样本服从单一类型分布的假设 ,并 且未利用负例样本. 根据实际样本的分布规律 ,利用 负例样本信息来设计 Q PM 算法和优化度量公式是 今后进一步研究的方向. 另外文献 [ 28 ]将权值调整 看作是基于某个优化准则的权值优化学习. 特征空间变换法与监督的降维技术在某种意义 上是一致的. 判别分析 (discriminant analysis ,DA) [ 29 ] 是被广泛应用的空间变换方法 ,通过该变换使得样本 在变换得到的空间上的类内离散度与类间离散度的 比值最小. CBMIR 中负例样本往往来自数目未知的 多个类别 ,正例样本则常常属于同一类别. 文献[ 29 ] 注意到正例和负例在数量和分布上的不对称性 ,提出 了一种有偏判别分析 ( biased discriminant analysis , BDA) 算法来寻找一个变换 ,使得在变换后的空间 中正例更聚拢 ,同时负例被分散. BDA 合理地处理 了负例样本 ,在实际中取得了比其他 DA 更好的性 能表现. DA 是基于正例样本服从高斯分布的假设 基础上 ,将其应用于非线性分布数据得不到理想的 © 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
2 2 475 计算机辅助设计与图形学学报       第 22 卷 效果. Zhou 等[29 ] 在 BDA 的基础上提出 KBDA (biased discriminant analysis using kernel) . 通过核技术将 非线性可分的样本映射到线性可分的核空间上 ,在 该空间进行 BDA 变换. 该算法比 BDA 在线性空间 和非线性核空间有更好的性能. 5. 2  基于概率统计分类模型 基于距离度量的模型是在图像类别几何可分的 前提下展开的 ,但实际应用中的图像库内容丰富 ,往 往不能满足该要求 ,此时可用概率统计的方法进行 分类 ,其中典型算法是基于生成模型的概率密度估 计的分类方法 ,高斯混合模型 、Bayes 网络是常用的 生成模型. 概率统计模型在性能上比欧氏距离等几 何划分图像类的方法更优越 ,但如果 Bayes 估计分 类方法是建立在假设特征向量分布为混合高斯分布 的基础上 ,这种假设对小概率事件会造成错误判断 , 影响分类结果的精确度. 近年来 ,结合生成模型和判别模型的混合生成 判别学习方法[ 30 ] 受到广泛的关注. 该方法首先对每 一类模式建立一个生成模型 ,然后用判别学习准则 对生成模型的参数进行优化. 文献 [ 31 ]结合判别学 习的 Bayes 网络也可以看作是混合生成 判别学习 模型. 该混合模型结合了判别学习与生成模型的优 点 ,为基于概率模型的 RF 技术提出了一个新的思 路 ,值得我们进一步的研究. 5. 3  基于机器学习的模型 目前更多学者愿意将 RF 看成为一个学习问 题 ,利用机器学习方法来处理 RF 有更好的性能表 现和推广性 ,是目前研究及应用最多的 RF 技术. 小样本学习是基于机器学习的 RF 技术的第一 个难 题 , 也 是 大 部 分 学 习 方 法 不 能 直 接 应 用 于 CB IR 中的一个主要原因. 解决的办法有 2 种 :1) 设 计适合小样本学习的学习机 ,如 BiasMap [ 29 ] ,DA 和 SVM 是目前表现最好的 2 个小样本监督学习机 ;2) 利用未标记样本来解决训练样本少的问题. CBM IR 中正例与负例样本的不对称性是 RF 中另一个需要 解决的学习问题 ,集成学习技术在解决样本不对称 问题上表现突出. 近年来 ,许多学者将半监督学习 、主动学习 、集 成学习 、长期学习和多示例学习等其他学习方法应 用于 RF 中来解决上述问题. 下面按所采用的学习 技术对基于机器学习的 RF 技术进行分类和论述. 5. 3. 1  监督学习 在监督学习方法中 ,SVM 由于在有限样本下有 良好的推广能力 ,在 RF 中被广泛使用. 尽管 SVM 是表现较好的小样本学习方法 ,但 当 RF 中样本过小时 , SVM 的性能将变差. 原因如 下 :1) SVM 的最佳分界面在训练样本很少时对样本 比较敏感 ,且不稳定 ;2) 当负例样本数远大于正例样 本数时 ,SVM 的最佳分界面将有偏离负例样本 ,会 将部分不相关样本误判为相关类别 ;3) 当样本数明 显小于特征维数时可能引起过学习问题 ,得不到良 好的泛化性能. 因此 ,对基于 SVM 的 RF 技术来说 ,小样本和 样本的不对称性是 2 个必须解决的问题 ;利用未标 记样本和正确处理负例样本是目前 2 个主要研究方 向. 针对标记样本少的学习问题 ,文献[ 32 ]提出一种 伪标记的概念来扩大训练样本集. 该算法将置信度 高的未标记样本加入标记样本训练集 ,获得了很好 的性能 ,但其未考虑样本的不对称问题. 如何有效地利用负例样本来解决样本不对称问 题是提高 RF 中学习机性能的另一个有效手段 ,如 BSVM ,BDA 等. 但无论是将负例样本看成一类还 是将每个负例视为单独一类的处理方法都不理想. Tao 等[ 33 ] 提出了更合理的处理方法 ,将所有正例样 本视为同一类 ,而负例样本聚类到一些小的子类中 , 每个子类有一个简单的分布. 在每个负例聚类与正 例聚类之间建立一个子分类器 ,可以在一定程度上 解决样本不对称问题. 集成多个子分类器进行 RF 分类不仅保存了每个子分类器的优点 ,而且大大地 提高了系统的泛化能力. 该算法将负例样本看作自 然聚类的多类别分布 ,但如何找到负例样本的语义 类别结构仍值得我们进一步研究. 5. 3. 2  半监督学习 在监督学习中 ,要达到好的推广性需要大量的 标记的样本 ,但搜索这些标记的样本很费力 ,而未标 记的样本相对是比较容易得到的. 近年来 ,人们开始 利用未标记的样本来解决小样本学习问题 ,以提高 学习机器的性能 ,它被称为半监督的学习方法. 协同学习算法是半监督学习中最重要的范例. 35 ] 将协同学习引入 CB IR 中 ,提出了基于 Zhou 等[ 34 协同学习的半监督 RF 方法. 协同学习是在具有充 分 、冗余的属性集的样本集上分别训练得到 2 个分 类器 ,每个分类器对未标记样本分类 ,将置信度高的 样本进行标记 ,并加入到另一个分类器的训练样本 集中 ;更新另一个分类器 ,直到分类器性能满足要 求. 协同学习是一种很有吸引力的半监督学习方法 , 但 2 个对属性集的约束对许多实际应用来说太严格. Zhou 等[ 36 ] 提 出 了 一 种 无 约 束 条 件 的 t ri t raining © 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
2 575 第 4 期 沈  晔 ,等 :基于内容的医学图像检索技术 算法 ,它首先对有标记示例集进行可重复取样 ,获得 3 个有标记训练子集 ,然后由每个样本子集训练得 到一个分类器. 在协同训练过程中 ,各分类器所获得 的新标记示例都由其余 2 个分类器协作提供. 具体 而言 ,如果 2 个分类器对同一个未标记示例的预测 相同 ,则该示例就被认为具有较高的标记置信度 ,并 在标记后被加入第 3 个分类器的有标记训练集. 在 对未标记示例进行预测时 ,t ri t raining 算法不再像 已有算法那样挑选一个分类器来使用 ,而是使用集 成学习中的少数服从多数投票来实现样本标记 ,以 提高分类器的泛化能力. 但是初始分类器往往比较 弱 ,未标记样本可能被错误标记 ,从而给第 3 个分类 器的训练引入噪声 ,使得半监督学习的性能不稳定. 针对协同学习中的噪声问题 ,该文采用了一种保守 的样本选择策略 ,对每一轮 RF ,每个学习机仅利用 负例标记置信度最高的 2 个未标记样本 ,有效地降 低了由于对样本的错误标记而引入的噪声. Li 等[ 37 ] Forest 算法有效地降低了噪声的影响 , 提出的 Co 与 t ri t raining 中采用 3 个分类器不同 ,该算法采用 N 个分类器解决了未标记样本选择的准确性问题 , 大大减少了噪声的引入 ,并且通过集成学习提高了 学习机的泛化能力及系统的性能. 该算法已成功地 应用于乳腺癌的 CAD 中 ,实验表明未诊断样本的 使用大大提高了 CAD 系统的性能. 另一方面 ,如果 未标记样本的数据分布不同于标记样本 ,使用未标 记样本反而会降低学习机性能. 如何利用与标记样 本一致的未标记样本且避开不一致的未标记样本 , 是未来的研究方向. 基于图的半监督学习是近年来半监督学习的一 个显著的成就. 文献[ 38 ]根据样本间的相似性构造 图后 ,利用图的局部平滑性将样本的标记信息不断 地向邻近的未标记样本传播 ,直到达到全局稳定状 态. 基于图的半监督学习在 CB IR 中的应用目前还 没有引起学者的广泛关注 ,在构造图的方法及处理 bridge 5. 3. 3  主动学习 point s 等问题上值得我们今后进一步研究. 主动学习是通过主动选择最富信息量的样本让 用户标记 ,以减少需要标记的样本数量和预期的反 馈次数. 主动学习有 2 种方法 :不确定采样和基于委 员会的采样. 前者是将学习机最没有把握确定类别 的样本让用户进行标记 ;后者是训练多个学习机 ,把 学习机之间不能达成共识的样本询问用户. 文献[ 39 ] 采用 SVM 和主动学习相结合的算法 SVMactive , 将最靠近 SVM 边界的样本点视为最能提供信息量 的样本 ,这也是应用最广泛的主动学习方法. 但此类 主动学习方法对学习机的分界面估计很敏感 ,特别 是在 RF 初期 ,训练样本很少 ,此时训练得到的分界 面不准确 ,主动学习的效果不理想. 文献[ 40 ]采用集 成学习技术来提高 SVM 在 RF 的初期的稳定性 ,并 取得了很好的效果. 文献 [ 41 ]针对 SVM 反馈初期 分界面不准确的问题 ,提出了边界修正技术来修正 首轮反馈后的分类界面 ,它将边界移向最不确定的 区域 ,使相关样本都为正值而其他样本为负值. 与传 统的 SVMactive 方法相比 ,该算法表现出了更好的 性能. 主动学习结合半监督学习的方法是近年来被 研究较多的主动学习技术. Zhou 等[ 34 ] 将半监督学 习中 2 个协同学习机给出相反判断的样本作为最能 提供信息的样本图像询问用户 ,并在此基础上提出 将半监督学习和主动学习的优点集成到 RF 中[ 35 ] , 它代表了最新研究水平. 其中半监督学习用来解决 小训练样本的问题 ,主动学习用来提高 RF 返回样 本的信息量. 该算法中主动学习是选择 2 个协同学 习机同时具有很低置信度的样本 ,提高了返回样本 的信息量. 协同学习中采用了只利用负例未标记样 本的保守策略来降低噪声的引入 ,提高了学习机的 性能. 5. 3. 4  集成学习 集成学习是一种新兴的机器学习范式 ,它使用 多个学习机来解决同一个问题 ,能显著地提高学习 系统的泛化能力. 集成学习有 2 个算法族 :Boo sting 和 Bagging. 一个集成学习通常分为 2 步 :1) 产生多 个子分类器 ,分类器之间需要差异化 ;2) 组合不同的 子分类器产生最后性能更优的分类器 ,子分类器的 产生方法分为并行产生和串行产生 2 类. Bagging 是一个典型 的 并 行 方 法 , 此 类 方 法 还 有 Random Subspace 和 Random Forest 等. Boo sting 算法族中 比较有代表性的算法是 AdaBoo st . 集成学习与半监督学习及主动学习相结合应用 于 RF 的方法[ 35 ,37 ] 取得了很有希望的成果 ,集成学 习使得学习机更加稳定和强大. 文献 [ 40 ]将集成学 习应用到 RF 中来处理 RF 面临的学习问题 ,是目前 集成学习在 RF 中应用的最高水平. 具体地 ,该算法 针对 SVM 分类器在 RF 初期样本少而且不对称的情 况下出现的不稳定、分界面偏离及过学习等问题 ,采 用了集成学习技术来提高 SVM 的性能. 文献[ 40 ]中 首先提出了 AB SVM (asymmetric bagging SVM) 算 法 ,与通常 Bagging 方法不同 ,非对称 Bagging 仅对 © 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
2 2 2 2 675 负例样本进行可重复取样. 基于正例样本集与可重 复取样得到的负例样本集来训练 SVM 子分类器 , 解决了样本不对称的问题. 另一方面 ,针对特征维数 过高引起的过学习问题 , 文献 [ 40 ] 中提出了 RS SVM ( random subspace SVM) 算法来解决该问题. RS 与 Bagging 类似 ,不同的是 RS 是对特征空间进 行可重复取样. 因此基于 RS 的 SVM 子分类器的训 练样本的特征维数会大大减少 ,解决了样本特征维 数过高问题 ; 同时通过采用投票的方式集成多个 SVM 子分类器 ,提高了 SVM 子分类器的稳定. 基 于 Corel 图像数据库的大量实验表明 ,集成学习技 术的引入大大提高了 RF 的性能 ;以往的研究结果 也表明 ,集成学习是提高 RF 中学习机性能的有效 手段. 如何将集成学习更好地应用到 CBM IR 应用 中是我们今后进一步研究的方向 ,文献 [ 40 ]中的算 法对此起到了很好的指示性作用. 5. 3. 5  其他学习技术 从一个长期学习的观点来看 ,用户在以往 RF 中积累起来的日志数据包含重要的图像语义信息 , 不仅可以加速学习过程 ,还可以克服训练样本少的 学习问题. 近年来 ,2 个长期学习技术[ 42 43 ] 被成功地 应用于 RF 中 ,其良好的性能表现使学者们意识到 通过长期学习利用历史反馈信息来提高 RF 性能的 重要性. 长期学习已经成为 CB IR 的一个新的研究 方向 ,也是一个值得深入研究的方向. 多示例学习是一种新型的机器学习框架 ,它被 看作与监督学习 、非监督学习和强化学习并列的第 4 种示例学习框架. 在此类学习中 ,训练集由若干个 具有概念标记的包组成 ,每个包包含若干没有概念 标记的示例. 若一个包中至少有一个正例 ,则该包被 标记为正 ;若一个包中所有示例都是负例 ,则该包被 标记为负. 通过对训练包的学习 ,希望学习系统尽可 能正确地对训练集之外的包的概念标记进行预测. 由于多示例学习能很好地刻画图像内容描述的歧义 性问题 ,为 CB IR 提供一个新的 、很有希望的技术方 法. 多示例学习在 CBIR 中的成功与否在很大程度上 取决于图像包生成算法的优劣 ,设计一个高效的图像 包生成方法是今后多示例学习在 CBIR 应用中值得 研究的关键技术. 文献[44 ]将 CAD 看作一个有少量 正例包和大量负示例的多示例学习问题 ,并对多示 例学习解决 CAD 问题进行了探索性的研究 ,该领 域还处于起步阶段. 如何将现有的多示例学习技术 计算机辅助设计与图形学学报       第 22 卷 及如多示例回归 、广义多示例学习等新技术付诸应 用 ,是 CBM IR 和 CAD 领域的一个很有希望的研究 方向 ;将多示例学习有效地用于解决乳腺癌的计算 机辅助诊断 ,这也是我们今后的一个研究方向. 6  展   望 医学成像技术的发展和 PACS (picture archiving and communication systems) 的日益普及对基于内 容的医学图像检索系统提出了严峻的挑战 ,我们认 为 ,CBM IR 领域未来的研究方向和发展趋势将包括 以下方面 : 1) 进一步探索与 CBM IR 相关的核心技术和算 法. 如利用数据挖掘技术在图像数据库特征集中发 现知识和规则 ,除了为医学诊断提供帮助外 ,还有助 于发现具有明显临床意义的特征分量 ,它可以从计 算机视觉的研究中借鉴新的图像特征表示 、相似性 度量以及目标识别技术. 考虑到 RF 问题中存在的 训练样本少 、实时性强 、训练样本不对称以及未标记 样本多的特点 ,引入和改进新的机器学习方法. 采用 长期学习的技术 ,从当前用户反馈信息的历史记录 中学习出一些隐含其中的语义概念 ,加快学习速度 并减少交互的次数. 2) 进一步提高 CBM IR 系统的性能 ,达到真正 实用的目的. 包括建立良好的用户交互界面 ;大力研 究数据库的存储和索引技术 ,提高海量医学图像数 据库的检索速度等. 3) 进一步拓展 CBM IR 技术的应用范围. 如在 现存的大量 PACS 和 RIS 中探索 CBM IR 技术在其 中的可能应用 ,增进其功能和附加值 ,如基于图像内 容检索的计算机辅助诊断技术等. 4) 进一步研究从二维医学图像到多维医学图像 检索系统的发展 ,建立一个通用的基于内容的医学图 像 3D 检索模型. 包括具有良好区分度的 3D 形状特 征的提取技术和非形状 3D 特征的表示 ;3D 模型中多 特征的融合技术和 RF 技术 ;3D 模型 CBM IR 的系 统评价方法 ;友好 、有效的用户检索界面等. 参考文献( References) : [ 1 ] Müller H , Michoux N , Bandon D , et al . A review of based image ret rieval systems in medical applications content benefit s clinical Informatics , 2004 , 73 (1) : 1 23 and f ut ure directions [J ] . Medical © 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
分享到:
收藏