logo资料库

医学影像计算机辅助检测与诊断系统综述.pdf

第1页 / 共45页
第2页 / 共45页
第3页 / 共45页
第4页 / 共45页
第5页 / 共45页
第6页 / 共45页
第7页 / 共45页
第8页 / 共45页
资料共45页,剩余部分请下载后查看
软件学报 ISSN 1000-9825, CODEN RUXUEW Journal of Software, [doi: 10.13328/j.cnki.jos.005519] ©中国科学院软件研究所版权所有. 医学影像计算机辅助检测与诊断系统综述 郑光远 1,2, 刘峡壁 1, 韩光辉 1   E-mail: jos@iscas.ac.cn http://www.jos.org.cn Tel: +86-10-62562563 1(北京理工大学 计算机学院 智能信息技术北京市重点实验室,北京 100081) 2(商丘师范学院 计算机学院,河南 商丘 476000) 通讯作者: 刘峡壁, E-mail: liuxiabi@bit.edu.cn 摘 要: 计算机辅助检测/诊断(Computer-aided Detection/Diagnosis, CAD)能提高诊断准确性,减少假阳性的产生, 为医生提供有效的诊断决策支持.本文的主要目的是分析计算机辅助诊断工具的最新发展.文章以 CAD 研究较多 的四大致命性癌症的发病医学部位为主线,按不同的成像技术和病类,对目前 CAD 在不同医学图像领域的应用进 行了较为详尽的综述,从图像数据集、算法和评估方法等方面作多维度梳理.最后分析了医学图像 CAD 系统研究领 域目前存在的问题并对此领域的研究趋势和发展方向进行展望. 关键词: 计算机辅助检测(CADe); 计算机辅助诊断(CADx); 医学图像; 肺癌; 乳腺癌; 结直肠癌; 前列腺癌 中图法分类号: TP311 中 文 引 用 格 式 : 郑 光 远 , 刘 峡 壁 , 韩 光 辉 . 基 于 医 学 影 像 的 计 算 机 辅 助 检 测 与 诊 断 系 统 综 述 . 软 件 学 报 ,2018,29(5). http://www.jos.org.cn/1000-9825/5519.htm 英文引用格式: Zheng GY, Liu XB, Han GH. Survey on medical image based computer aided detection and diagnosis systems. Ruan Jian Xue Bao/Journal of Software, 2018,29(5) (in Chinese). http://www.jos.org.cn/1000-9825/5519.htm Survey on Medical Image Computer Aided Detection and Diagnosis Systems ZHENG Guang-Yuan1,2, LIU Xia-Bi1, HAN Guang-Hui1 1(School of Computer Science and Technology, Beijing Institute of Technology, Beijing 100081, China) 2(School of Computer Science and Technology, Shangqiu Normal University, Shangqiu 476000, China) Abstract: Computer aided detection/diagnosis (Computer-aided Detection/Diagnosis, CAD) can improve the accuracy of diagnosis, reduce false positive, and provide decision supports for doctors. The main purpose of this paper is to analyze the latest development of computer aided diagnosis tools. With clue of the top four fatal cancer’s incidence positions, according to the different imaging techniques and diseases, major recent publications are reviewed in this survey, covering CADs in different medical imaging areas. From image data sets, algorithms to evaluation methods, researches are analyzed in multi aspects. Finally, this paper analyzes the existing problems in research field of medical image CAD system, and prospects the research trend and development direction in this field. Hope to inspire new ideas of researchers. Key words: Computer-aided Detection; Computer-aided Diagnosis; medical image; lung cancer; mammary cancer; colorectal cancer; prostatic cancer  基金项目: 国家自然科学基金(60973059, 81171407); 中国新世纪优秀人才支持计划(NCET-10-0044) Foundation item: National Natural Science Foundation of China (60973059, 81171407); Program for New Century Excellent Talents in University of China (NCET-10-0044) 收稿时间: 2017-01-20; 修改时间: 2017-04-29, 2017-07-26; 采用时间: 2017-11-30; jos 在线出版时间: 2018-01-9 CNKI 网络优先出版: 2018-01-11 17:25:02, http://kns.cnki.net/kcms/detail/11.2560.TP.20180111.1724.017.html
2 英文缩写与全称对照表: 全称 Adaptive Network American Cancer Society Artificial Immune 缩写 IDRI JSRT Autofluorescence Endoscopy Artificial Neural Network Area Under Curve breast Computed Tomography Broyden-Fletcher-Goldfarb-Shanno Back Propagation Neural Network Computer-Aided Detection Computer-Aided Diagnosis Content-Based Image Retrieval CranioCaudal Correlation-based Feature Subset Selection for Machine Learning Contrast Histogram Equalization Convolutional Neural Network Colorectal Cancer Computerized Tomography CT Colonography Chan-Vese Chest X Radiograph Deep Belief Network Adaptive Limited Journal of Software 软件学报 全称 The Infectious Disease Research Institute of Society Radiological Japanese Technology k-Nearest Neighbor Linear Discriminant Analysis Location Index Lung Image Database Consortium Lung CT Imaging Signs Learning Vector Quantization kNN LDA LI LIDC LISS LVQ MFFNN Multi-layer Feed Forward Neural Network MIAS MLO MLP MR The Mammographic Image Analysis Society Medio Lateral-Oblique Multilayer Preceptor Magnetic Resonance MRI Magnetic Resonance Imaging MTANN Massive-training Artificial NeuralNetwork MTB NC NCIA NN OC PACS Mycobacterium Tuberculosis Nearest Centroid National Cancer Image Archive Neural Network Optical Colonoscopy Picture Archiving Systems Principal Component Analysis and Communication 缩写 A2INET ACS AFE ANN AUC bCT BFGS BPNN CADe CADx CBIR CC CFS CLAHE CNN CRC CT CTC CV CXR DBN DDSM ELCAP ELM ESN FCM FDR FFNN FFT FLD FLDA FP FPR FROC GA GGO GMM GLCM GLRLM 1 前 言 The Digital Database for Screening Mammography The End-Use Load and Consumer Assessment Program Extreme Learning Machine Echo State Network Fuzzy C-Means Fisher Linear Discriminant Ratio Feed-Forward Neural Network Fast Fourier Transform Fisher Linear Decriminant Fisher Discriminant Analysis False Positive False Positive Rate Free-Response ROC Curve Genetic Algorithm Ground-Glass Opacity Gaussian Mixture Model Gray-Level Co-occurrence Matrix Gray Level Run Length Matrix PCA PNN PPV RF RFNC RIF ROC ROI RRF SCLGM SDAE SFS SVM TCIA TNR TPR VOI wkNN Probabilistic Neural Network Positive Predictive Value Random Forest Relief-F Non-Correlated Resistance to Rifampicin Receiver Operating Characteristic Regions Of Interest Rocchio relevance feedback algorithm Square Centroid Lines Gray Level Distribution Method Stacked Denoising Autoencoder Sequential Forward Selection Support Vector Machine The Cancer Imaging Archive True Negative Tate True Positive Rate Volume Of Intretest Weighted kNN 医学影像(Medical Imaging),是指为了医疗或医学研究,对人体或人体某部分,以非侵入方式取得内部组织 影像的技术与处理过程.随着各种科学技术的迅速发展, 医学影像技术也有了飞速的进步[1] , 逐渐形成了以 X 射线(包括 CT)、磁共振成像、超声和核医学为代表的多种医学影像方法[2] .目前应用于医疗的影像技术主
郑光远 等: 医学图像计算机辅助检测与诊断系统研究综述 3 要有:基于 X-ray 的,基于超声波的,基于伽马射线的,基于磁共振的,光学摄影(内视镜)和其它成像技术(如萤光血 管显影术,显微镜等).医学影像逐渐在疾病诊断中变得不可或缺[3] ,特别是在癌症诊断中与活检相结合,逐步成 为精确定论的重要依据[4] .但随着科学技术的发展和医学影像应用的推广[5] ,有越来越多的医学图像需要医 生解读[6] .医学图像解读逐渐成为一个挑战性的工作[7] ,医生有可能会因为经验不足或疲劳而产生解读错误, 疏漏一些疾病[8] ,导致假阴性出现[8] -[15] ,也可能将非病变解读为病变或将良性病变误解读为恶性,导致假阳 性出现.据统计,医学影像的疾病误诊率可达到 10%-30%[14] [16] .由此产生的假阴性结果会使病人错过最佳的 治疗时机,而假阳性病例一般要依靠活检等临床手段排除,这不但增加了病人的费用,也给他们增添了痛苦和病 情恶化风险.在此形势下,计算机辅助检测(Computer Aided Detection, CADe)与计算机 辅助诊断(Computer Aided Diagnosis, CADx)的出现最终成为时代的需求[7] [9] [17] . 1963 年,Lodwick 等发表了把 X 光片数字化的方法[18] [19] ,基于医学图像的 CAD 开始产生,在此领域的研 究也开始活跃[20] [21] .现在 CAD 通常被看作医生的诊断决策参考[22] [23] 和“第二意见(second look/opinion)” [12] [24] ,CAD 能减轻医生的工作负担[25] ,但还不能替代医生诊断[11] .经过 50 年的发展,特别是近些年,医学 图像 CAD 系统研究成果丰硕,已经成为医学影像学和放射诊断学领域的热门课题[13] ,在各种疾病诊断中被广 泛应用[26] .CAD 系统对于疾病的早期筛查尤为重要.早期筛查对于疾病诊断、治疗起着重要的作用.肺癌、乳 腺癌、结肠癌和前列腺癌是目前四大患病率和死亡率最高的疾病.肺癌是世界上致病率[27] 和致命率最高的癌 症,2015 年统计表明,在中国约有 4,929,000 新增病例和 2,814,000 个癌症死亡[28] .在美国每年约有 221,200 新 增病例,死亡 158,040 人.肺癌的总体 5 年存活率为 16.8%[29] .早期筛查是减少肺癌死亡率最有效的方法[30] . 肺部筛查检查出的癌症患者 85%为临床 I 期,他们的 10 年存活率为 88%[31] .乳腺癌早期筛查项目能减少 30%-70%的致死率[32] .大多数结肠癌来自息肉,而息肉转变成癌症一般要 5-15 年的时间,早期检测和去除 10 毫米以下的息肉能有效减少结肠癌的发病率[33] [34] .前列腺癌目前在美国男性中是发病率最高的癌症[35] ,早 期发现和切除病灶是疾病治疗和提高病人生存率最有利的方法[36] .目前,学者对 CAD 系统的研究针对以上四 种癌症的较多.本文以这些医学部位为主线,结合由不同成像技术所产生的不同特性的医学图像,从应用 CAD 系统较多的病类出发,对医学图像 CAD 系统近几年的研究进展进行综述. 本文剩余部分按以下方式组织:第 2 节对医学图像 CAD 系统进行概述;3-6 节分别从肺、乳腺、结直肠、 前列腺 4 部分,每部分按不同的成像技术和病类对近几年的 CAD 系统进行了梳理;第 7 节回顾了医学图像 CAD 系统的性能评估方法;第 8 节汇总了文中提到的 CAD 系统所用的主要算法和去假阳性或诊断分类时用到的 特征;第 9 节对此研究领域面临的问题作了描述并对研究前景进行展望;第 10 节对本文作总结. 2 医学图像 CAD 系统概述 基于医学图像的 CAD 系统分为两类:一类是计算机辅助检测(Computer Aided Detection,CADe)系统,在医 学图像上检测异常并定位呈现出来;另一类是计算机辅助诊断(Computer Aided Diagnosis,CADx)系统,在医学 图像上检测异常并帮助医生决定异常的类别以及恶性级别.CADe 系统与 CADx 系统的一般处理框架如图 1 所 示. 从图 1 可以看出 CAD 系统一般包含 7 个步骤:图像获取、预处理、图像分割、感兴趣区域(ROIs)检测、 特征提取、特征选择、去假阳性(CADe)或诊断分类(CADx).CADx 系统也可以在假阳性去除步骤后再进行特 征提取、特征选择、ROIs 良恶性分类(或评估).不同类别医学图像在 CAD 的具体环节上略有不同. 图像获取是指系统获取医学图像的方式,一般有三种方式:1.从自建影像库,这些库一般是用从合作医院得 到的医学图像建立的[37] ;2.通过影像产生设备所附系统,如 PACS 读取数据[38] ;3.直接从成像系统实时得到 数据[39] . 预处理过程是指矫正由于介质衰减、噪声或运动伪影而导致的失真,对原始图像做归一化处理[40] ,通过去 噪和增加对比度的方式增强图像的显示质量[41] ,以便后续环节的处理. 为了减少外围组织或背景对感兴趣区域(ROI)检测的干扰,减少计算量,预处理之后有些 CAD 系统还要进
4 Journal of Software 软件学报 行一步图像分割操作,把欲研究区域从背景或周围组织中分离出来.图像分割是这一步也是 CAD 系统的基础, 也是图像处理中最重要的步骤之一[42] ,对图像的分析任务非常重要,大部分图像描述和识别技术高度地依赖 分割的结果[43] . 自建图库 PACS 成像设备 CADe 特征提取 特征选择 去假阳性 图像获取 预处理 图像分割 ROIs 检测/分割 CADx CADx 特征提取 特征选择 分类 Fig.1 A general workflow of computer aided detection/diagnosis systems 图 1 CAD 系统流程图 ROI 检测是依据密度、形状等特征把所有疑似病变的区域抽取出来.抽取的信息包括了 ROI 的位置和形状 等特征,把 ROI 从周围的组织中标记出来,所以有时也叫 ROI 分割. 特征提取是利用算法计算 ROI 的各种特征值,如形状特征、视觉特征和密度特征等. 特征维数较多时要对特征作优化选择,只保留对分类结果作用大的特征,即特征选择. 计算机辅助检测(CADe)与计算机辅助诊断(CADx)的区别是 CADe 系统在这个环节把检测到的疑似区域 标注出来呈现给医生做诊断[44] ,为了提高检测准确性要进行假阳性去除.CADx 系统对得到的 ROIs 进行良、 恶性分类或良恶程度分级,即实现对疾病的诊断,也可 CADe 基础上对检测结果作进一步诊断. 3 肺部医学图像 CAD 系统 3.1 基于胸部X光片(CXR)的肺结节CAD系统 3.1.1 CXR 的肺结节 CAD 系统 X 光片是最早应用于医疗诊断的影像技术,现在仍是最常用的检查方式之一.Nagata[45] 等实现了一个在 胸部 X 光片上诊断结节的 CAD 系统,CAD 中引入了主动轮廓方法,并对多域值算法作了改进.系统分四个阶 段:(1)首先用主动轮廓模型在胸片图像上分割出肺,然后检测出肺的顶点、中线、长和宽与已有的模板通过参 照点进行配准,归一化;(2)用模板匹配方法检测初始的结节候选区域,把归一化的肺部图像用 7×7 个 64×64 像 素的矩阵化分开,对每一个小区域通过阈值法检测 ROI;(3)对 ROIs 进行两个阶段分类,去除假阳性.第一阶段 先用图像局部增强对比法分割出候结节区域,用密度梯度计算检测出结节.第二阶段用多尺度模板匹配技术进 一步对检测到的结节作假阳性去除.本算法取得了良好的实验结果,作者还发现,如果分类时考虑更多的特征系 统性能会得到一步提升. Htike[46] 等展示了一个三层框架的肺结节 CAD 系统.在预处理层,作者选用了拉普拉斯滤波器对图像进行 处理.特征抽取层从图像的灰度共生矩阵中提取了对比度、能量和熵等 44 维特征.在分类层,使用了旋转森林进 行分类,X 光图像被随机的分成 K 个子集,在每个子集用 PCA 把子集上的特征投射到低维的空间并保持尽可能 多的特异性,这样形成了基于新特性的基分类器,以达到提高分类准确度的同时保持分类的多样性.这个集成的
郑光远 等: 医学图像计算机辅助检测与诊断系统研究综述 旋转森林框架的分类准确度达到了令人满意的实验结果. 5 秦菊[47] 等对商用的 CAD 系统 IQQA®Chest 的临床应用效果进行了对比实验.由 5 名不同年资医师对 300 例中有 100 例是肺结节患者的医学影像进行诊断,三个月后再用 CAD 系统辅助重新诊断.对照两次诊断结果显 示,CAD 系统对数字化胸片肺结节检出的敏感性和特异性等都有影响,对特异性有明显的提高趋势. 3.1.2 CXR 上的其它 CAD 系统 Harrison[48] 等建立了一个通过阈值化时间减影图像来确定病理变化候选区域的 CAD 系统.每一个域值技 术产生两个不同的候选区域:亮区和暗区.文章中对比测试了 10 个不同的域值技术.与全局域值化图像相比,通 过分别域值化亮和暗的候选区域,恰当地提高了域值区域的数量,得到更少的全局候选区域,但包括更多的实际 病理性变化. 由于成像对象的厚度和肺域的重叠,侧面视图通常在对比度和信噪比方面都表现出较差的图像质量.因此, 找出侧面胸部的肺部轮廓是很困难的.侧位肺部 X 光片能够提供用于肺气肿识别的重要信息,例如仅在侧位视 图中才能看到后胸部空间的扩张,其也能准确地描述隔膜扁平化,然而结合侧位信息的计算机诊断研究确很 少.Coppini[49] 等利用前后位和侧位的放射图像识别肺气肿.针对前后位和侧位视图下的肺区域分割问题,作者 将肺边界建模为闭合的模糊曲线,这样分割任务被转化成了像素成员的隶属度估计问题,取决于图像的非线性 和空间变化的特征.对此,作者又引入了多层神经网络,改进的 Kohonen 网络.由于其有拓扑保留特性,能够作为 一个脊检测器平滑地增强边界的闭合,有效地解决了 CXR 上肺轮廓分割的难题. Cao[50] 等介绍了一个基于小波分析的肺间质病理诊断 CAD.在预处理环节,作者首先用 sym5 小波变换图 像到一个二层分解中,接着用一个函数量化高频系数阈值,去掉频率高于域值的高频部分,结合低频系数重建二 维小波信号.在特征抽取环节利用小波变换抽取多分辨率和时频域局部特征.Muyoyeta[51] 等开展了一个结核 病诊断的 CAD 系统与 Xpert MTB/RIF 试剂测试方法的对比实验.对 350 个中有 291 个有结核病的人群,用 CAD 和 用 Xpert MTB/RIF 试 剂 测 试 方 法 测 试 得 到 相 同 的 敏 感 性 、 特 异 性 、 阳 性 预 测 值(PPV)和 阴 性 预 测 值 (NPV).CAD 的 AUC 为 0.71.实验结果表明,CAD 系统可以提高结核病筛查的有效性. 3.2 基于CT图像的肺部CAD系统 X 光成像是一种光影投影,只显示一个方向上的物体结构,体内不同器官会发生重叠,显示不清楚.CT 计算 多角度的投影,将这些信息合成横截面图像.CT 图像的分辨率是 X 线的 10-20 倍,能够分辨尺度较小的组织病 变,CT 影像是一系列连续的断层图片,在此基础上可以对肺部进行 3D 建模,比 CXR 更适于肺部疾病诊断.目前 肺部疾病的计算机辅助检测/诊断研究大都集中在 CT 图像上进行. 3.2.1 基于 CT 图像的肺结节 CAD 系统 目前 CT 检查是肺癌筛查最有效的手段,越早发现,病变越小,治愈率越高[52] .CT 图像的高分辨率[53] 和高 解剖结构对比度能够显示用传统 X 光影像几乎看不到的结节,肺结节是“圆形模糊,有适度的边缘,直径不大于 3CM”[54] 的异常(如图 2 所示),小于 1CM 的则叫微结节.结节大都是肺癌的潜在表现.对以前的 CT 影像回顾 研究表明,75%的癌症在早期影像检查中已经表现出来,但由于此时结节很小[55] [56] ,易被医生疏漏.另外由于 读片的工作量大,医生经验不足或疲劳等因素也会产生一些解读错误.现有 CAD 系统多是致力于弥补医生诊断 的这些不足. 下面按第 2 节所归纳的 CAD 系统的一般处理框架,对现有基于肺部 CT 图像的 CAD 系统进行介绍: (1) 预处理 CT 图像相对 X 光片本身的噪声已经很少,但为了得到更精确的结果,也用一些算法对图像做 预处理,给 CAD 后面的操作提供更好的输入.Messay[57] 等采用降采样算法对训练用的 CT 图像采 样,产生可比较的片间距离,同时可以提高计算速度,减少噪声.为了增强细节对比度还使用了局部对 比增强算法.为了去除加性噪声,Darmanayagam[58] 等使用了 wiener 算法.Ashwin[59] 等用有限对比 自适应直方图均衡法(CLAHE)去除在图像捕捉中由于眩光、噪声引起的图像对比度不高的情况.此 外还有增强滤波(Enhancement Filter)、快速傅立叶变换(Fast Fourier Transform)、小波变换(Wavelet Transform)、噪声校正(Noise Correction)[37] 、中值滤波(Median Filtering)、Gabor 滤波、直方图均
6 Journal of Software 软件学报 衡(Histogram Equalization)[60] 等算法在预处理时使用.在 AL-TARAWNEH[61] 等提出的肺癌检测技 术中,分别使用了 Gabor 滤波、自动增强和快速傅立叶变换算法对肺部 CT 图像进行预处理,实现去 噪声、污染和干涉的目的. Fig.2 Pulmonary nodules 图 2 肺结节 (2) 分割 肺部 CT 图像上还包含背景、肺壁、心脏和肝等其它器官区域,在图像预处理阶段要确定肺叶 范围,抽取肺实质(也叫肺实质分割).肺实质分割在肺部疾病诊断中是最为关键的步骤之一[62] .这个 阶段精确的分割对提高系统的最终性能是非常重要的[63] .对增强肺结节检测的可靠性、准确度、 精度和减少计算量起着重要的作用[64] .CT 图像上的像素 CT 值是与组织密度成正比的,常用阈值法 分离体腔和肺实质[57] .有学者使用迭代阈值法[58] 进行肺实质分割.Firmino[65] 等使用了区域增长 法和形态学法.进一步的分割还用到区域、形状、相邻解剖学引导[57] 和机器学习的方法[66] .由于 胸膜牵拉、近胸膜结节等原因,有时分割得到的肺叶有缺口,常用滚球法[67] 等形态学方法来修正边 缘. (3) ROI 检测 ROI 检测的目的是查找肺叶中的肺结节,如果有则确定其位置[37] 和区域信息.这个环节 的算法要高敏感度,追求的性能目标是不漏检,即召回率 100%.常用像素亮度、形态学和纹理等特征 检测结节[65] .检测方法有灰度域值法[68] 、多阈值法[57] [43] [59] 、区域增长法[58] .Krewer[69] 等 在 3D 结节分割时采用了单点集合分割算法.此外还有圆柱形和球形过滤、基于模式、形态学算子 [57] 、聚类、连通成份分析、基于规则的算法.Wang[70] 等在 2D 和 3D 模式下分别用到了滚球和区 域增长法.Shi[71] 等的 CADe 系统中在 ROI 分析和提取时使用海森矩阵分析和双边拉普拉斯变 换.Li[72] 等的 CADe 系统在感兴趣区抽取环节使用了 2D 大津法和数学形态学方法.3D 模式下有时 还用到基于三维物体建模和血管提取技术[41] 等. 虽然 3D CNN 是对时空数据进行统计建模很有前景的工具,但是它们有一个限制是需要详细的 3D 标 签,与获得 2D 标签相比,这是非常昂贵的.现有的 CAD 方法依赖于获得大量肺结节的详细标签来训练 模型,这也是困难和耗时的.为了减轻这一挑战,Anirudh R[73] 等提出一种解决方案,方案中专家只需 要提供点标签,即结节的中心像素,以及其最大的预期大小.程序使用非监督方式分割来扩展 3D 区域
郑光远 等: 医学图像计算机辅助检测与诊断系统研究综述 7 得到标签体,用于训练 CNN.最后在 SPIE-LUNGx 数据集上进行实验表明,即使没有准确的 3D 标签, 使用这些弱标签训练的网络也能在产生合理的高灵敏度同时保持低假阳性率. (4) 特征提取 要判断 ROIs 是不是结节,是良性病变还是恶性结节,CAD 系统一般是根据有经验医生标 注的样本库训练算法模型,从形状、纹理、灰度和形态学等角度在候选区域上提取特征值,利用这些 特征值区分不同类别相近的对象.磨玻璃密度影(GGO)结节 59-73%是恶性,实性结节是恶性的概率 是 7-9%,外形不规则、分叶征和毛刺征的多为恶性,外形圆形匀滑的多为良性[65] .Demir[74] 等在实 验中发现,在 CADe 系统中使用了外部表面纹理特征后系统的分类性能会有明显的提升.病人人口学 特征、生活习惯特征,如年龄、吸烟史等有时也常会用到. 医学图像诊断领域,尽管有各种优秀的算法出现,但传统方法建立的特征抽取和模型选择总难 鲁棒地泛化.卷积神经网络(CNN)的应用使这一问题得到很好地解决,CNN 基于人工神经网络,针对 不同分类任务,通过反向传播算法自动强化或削减相应特征的权值,在卷积层用滤波器自动抽取特 征,实现图像特征提取[83] .图像可以直接作为 CNN 的输入,从而避免了传统算法中复杂的特征提取 设计和数据重建过程. 对于胸部 CT 肺结 节诊断分 类的问题,与传统主要依赖 于 结节分割进行区域分 析的研 究不 同,Shen W[248]等直接对原始结节图像块建模,而不预先定义结节形态.作者提出了一个分层学习框架 “多尺度卷积神经网络”,通过交替堆叠的层提取判别特征来捕获结节的异质特性.为了充分量化结 节特征,该框架利用多尺度图像块来学习一组特定于类的特征.同时对每个尺度输入,通过串联神经 元在最后一层获得激活.最后在 LIDC-IDRI 上对该方法进行了评估,证实了不用图像分割而直接对结 节进行诊断分类是可行的. (5) 特征选择 特征选择指选择使分类结果最显著的特征子集的过程[76] .目的是减少冗余的特征,降低 特征维数[77] ,以提高运算效率,最大化分类准确性.降维常用到 LDA 和 PCA 两个经典的算法,LDA 对特征值进行新的投影,投影后不同性质的数据点的距离更大,同性质的数据点距离更紧凑,PCA 从 协方差的角度,将高维的特征映射到低维空间中表示,并期望在所投影的维度上数据的方差最大.特 征选择不做投影或映射,仅从所有特征中选择部分特征使用.常用的算法有 RELIEF 法、顺序向前法 (SFS)和遗传算法(GA)[78] [79] [80] [81] 等. 特征的高维不相关、特征子集的异构性以及样本类别分布不均衡一直是肺结节检测准确率的阻 碍.Cao[82] 等在肺结节检测 CAD 中,用一个基于多核的框架解决这些问题.为了消除特征的高维不相 关性,整合多内核学习和特征选择,作者提出了两种基于多内核的特征排序技术,根据从基于内核的 特征选择函数(MKFF)导出的内核空间中的预测能力(分数)来选择识别特征,以减小特征向量的大小 和提高分类性能.为了有效地融合和选择异构的特征子集,作者通过带混合 l2,1 核权重约束的多内核 学习法,恰切地结合有关参数结构的辅助信息,以利用互补异构特征子集同时考虑不同多个特征子集 的分类贡献.为了解决不平衡结节数据学习的问题,作者提构建一个最优多内核过采样方法来平衡数 据分布. 这个方法可以生成准确的实例,解决在构建内核分类器模型时输入空间中执行过采样的不 一致问题.该方案性能的几何均值和 AUC 都明显超过实验中的其它对比方法. 纹理特征具有很强的表征力和特异性,Krewer[69] 等在已有的基础上研究新 CADx 系统过程中, 在大小、形状等的基础上加入纹理特征,尝试用 Relief-F 、RFNC、CFS 算法进行特征选择,并分别结 合 J48、RF、k-NN 和 SVM 分类算法实验.在特征选择过程中,Laws 和小波特征结合得到最好的级别, 也意味着对分类性能贡献最大.最佳的整体性能是 CFS 特征选择、5-NN 分类器和仅用纹理特征的数 据集组合.这表明分类时采用纹理特征是有前景的. (6) 去假阳性 检测的结果中有一部分得到的 ROIs 不是结节,可能是表现相近的有大曲率或分叉的厚血 管、呼吸或心脏运动及肺实质组织上的散射形成的斑迹等.上述非结节 ROIs 也叫假阳性(False Positive,FP)ROIs,需要去除,为此需要对得到的 ROIs 提取特征.常用的有密度[57] 、形态学[58] 、纹
8 Journal of Software 软件学报 理[65] 等相关特征,也有基于统计学的如灰度共生矩阵[58] (GLCM)特征,根据得到的特征值对 ROIs 进行真阳性和假阳性分类,去除假阳性区域.对于 CADe 系统,通过这个环节将带有位置标注的区域 作为输出供医生诊断.CADx 系统还要在此基础上对得到的区域进行良恶性诊断,有的 CADx 系统没 有去除假阳性环节,在最终分类结果中体现 ROI 类别. Camarlinghi[84] 等 对 蚂 蚁 探 索 通 道 模 型(Channeler Ant Model), 立 体 区 域 增 长 平 台 (Region Growing Volume Plateau)和基于体素的神经网络方法(Voxel Based Neural Approach)三个 CADe 系统 分别做了详细的介绍,并依据每个 CADe 系统的不同性能指数进行了三者加权融合的分类研究.在去 假阳性环节分别用前馈神经网络(FFNN)和支持向量机算法.实验结果表明,相对于单个系统,不同系 统结合的检测性能有明显提高,作者分析这主要是得益于它们在识别假阳性方面贡献是互补的. Wang[70] 等的 CADe 系统中设计了一个基于三阶张量模式的 SVM 算法,可以直接对感兴趣体 (VOI)进行分类.作者使用 SVM、MTANN、SVM(matrix)、SVM(based on unfolding 3D matrixes)和 SVM(3Dmatrix)5 个 CAD 方案作对比,SVM(3Dmatrix)达到了 98.2%的敏感性,假阳性率为 9.1FPs/切 片,总体上更优. (7) 分类 在 CAD 系统中,常用的分类算法有基于规则的分类器、LDA、模式匹配、神经网络(NN)、马 尔科夫随机场、SVM[85] [86] [87] [88] [89] [41] [65] ,线性判别分类器[57] 、k-NN[43] 、多层神经网 络(ANN)[58] [90] 、决策树[91] 等.为了提高肺结节分类识别的准确率,李秋萍[92] 等提出了一种半监 督 FCM 聚类算法,引入专业医生标记的监督信息来指导聚类过程,通过衡量两个样本特征向量之间 的距离,获得它们被划分到同一类别中的可能性,最后参考隶属度对非标记样本进行聚类,在一定程 度上解决了传统聚类算法聚类效果不理想的问题. 基于逐像素的深度学习方法如 CNN,由于能避免由对复杂和细微对象的特征计算或分割不准确 而导致的计算错误,显示出了良好的发展前景[87] [93] .最近的研究表明由 CNN 抽取的特征是可以通 用的,能用于训练网络的特定领域之外的分类任务.在[94] 中作者使用 OverFeat,训练用作自然图像 中目标检测的网络.对 LIDC 数据库中 865 个 CT 图像上的每个结节所在区域块,分别从矢状、冠状 和轴向面抽取特征,在网络的倒数第二层得到 4096 维的特征,最后用线性 SVM 分类.对于各种参数配 置,使用现成的 CNN 特征,系统都执行的相当的好,但性能不如常规专用的检测系统.当把两种方法结 合后,得到的结果明显比单独的好.从实验结果看,在三维医疗数据辅助检测任务中 CNN 特征具有进 一步研究的价值. 3.2.2 基于 CT 影像的肺部其它疾病 CAD 系统 针对其它系统假阳性率太高的情况,Tajbakhsh[95] 等用一个新的血管对齐多平面图表示方法和 CNN 实现 CT 肺 血 管 造 影 图 像 上 的 计 算 机 辅 助 肺 栓 塞 检 测 系 统. 系 统 先 进 行 肺 分 割,然 后 用 雪 降 算 法(Tobogganing Algorithm)抽取肺栓塞候选区域.对每个区域用血管对齐多平面图像描述产生一个 2 通道图像表示.把得到的 2 通道图块放入一个 CNN 进行栓塞和非栓塞分类.尽管在 2 毫米和 5 毫米定位误差上稍有不足,系统的诊断性能 明显优于传统的手动选取特征的方法. 4 乳腺医学图像 CAD 系统 4.1 基于钼靶影像的乳腺CAD系统 乳腺钼靶摄影(Mammography)是一类用低剂量 X-ray 检查乳腺的技术,具有全面、直观、操作简单、安全 和费用比较低廉等特点,是目前诊断早期乳腺癌的首选而有效的方法[96] .钼靶影像按头尾位(CC)和内外斜位 (MLO),双侧分别产生两张图像(如图 3 所示[97] ).CAD 系统利用计算机图像技术检测或诊断乳腺影像上的异常 如肿块、微钙化和结构变形这些病变.
分享到:
收藏