中国科技论文在线
http://www.paper.edu.cn
细胞图像自动识别技术研究
张桂贤,刘建国**
(华中科技大学自动化学院,武汉,430074)
5 摘要:随着计算机图像处理在医学领域越来越广泛的应用,应用模式识别和图像处理方法识
别细胞总数和分类计数成为医学辅助诊断的一个重要方法。本文依据粪便显微图像的特点,
利用边缘检测和阈值分割对图像进行分割,并根据面积、圆形度等进行细胞识别分类。实验
表明,本文提出的方法在粪便显微图像识别中效果良好,具有研究价值和应用价值。
关键词:图像处理;模式识别;边缘检测;阈值分割
中图分类号:TP391
10
Study on Automatic Recognition of Cell Images
ZHANG Guixian, LIU Jianguo
15
(School of Automation, Huazhong University of Science and Technology, Wuhan, 430074)
20
Abstract: With the wide application of digital image processing in medical areas, pattern
recognition and image processing, which is used in the sum and sort counting of cells, is one of
the important methods in medical-aided diagnosis.In view of the features of fecal microscopic
images, the author uses edge detection and threshold segmentation to segment the images, and
uses area and circularity in cell identification and classification.The experiment results show that
the algorithm is effective in the recognition of fecal microscopic images, the results of the study
have both theoretical and practical values.
Key words: image processing;pattern recognition;edge detection;image thresholding
25
0 引言
传统的细胞识别分析,是在显微镜下观察超薄切片,根据细胞形态和数量进行定性和定
量描述,并据此判断病情[1]。这种方式,强烈依赖医务人员的专业水平和责任心,因此很容
易产生主观性和片面性,与科学的客观性不符。
细胞图像自动识别是运用计算机处理医学图像并识别对象的技术,它是计算机,图像处
30
理,模式识别及人工智能等理论和技术相互促进的产物[2] [3]。将图像识别技术引入医生的诊
断过程中,可以提高诊断的一致性,减少个体的主观性和片面性,减少医生的工作量,还可
以提取出人眼观察不到的信息,辅助医生诊断。
目前临床上普遍使用的细胞图像识别工具是血液细胞分析仪[4],它通过人体血液样本的
显微图像来分析细胞成分,血液细胞分析只能用于检测人体内是否有感染、是否贫血、是否
35
有血液疾病等,对于肠胃出血、感染等消化系统疾病只能通过人体粪便中的细胞成分来判定。
人体粪便图像与血液和尿液有明显区别,主要表现为血液一般较为新鲜,细胞变形较少,
杂质较少,细胞和背景对比度高。而粪便中细胞经过人体消化系统排出体外,细胞发生较大
的变形,图像背景颜色深,杂质多,自动分析较为困难。另外,由于血液杂质较少,一般对
样本进行干燥染色,提高细胞和背景的对比度,之后进行细胞识别。而粪便样本进行稀释后,
40
含有较多杂质,若对该样本进行染色,则细胞和杂质都会被染色,无法识别出细胞。
本文针对粪便显微图像细胞分析这一课题,对采集的粪便显微图像进行分析,针对白细
胞、红细胞特点,采用模式识别和图像处理技术,探索出一种快速高效的细胞识别统计方法。
作者简介:张桂贤(1989-),女,主要研究图像处理和细胞识别
通信联系人:刘建国(1952-),男,教授,主要研究方向:视觉导航 快速计算. E-mail: liujg11@126.com
- 1 -
中国科技论文在线
1 细胞图像分割
1.1 基于边缘检测的图像分割
http://www.paper.edu.cn
45
基于边缘检测的图像分割是利用图像中目标与背景之间的灰度不连续性[5]。这种变化可
以用边缘检测算子检测得到。常用的边缘检测算子[6]有 Roberts 算子、Sobel 算子、Prewitt
算子、Canny 算子和 Laplace 算子等。
为了比较它们的分割效果,在 Matlab 的环境下对细胞图像进行分割,分割结果如图 1-6。
50
图 1 细胞灰度图像
图 2 Roberts 算子效果 图 3 Sobel 算子效果
Fig.1 cell picture
Fig.2 result of Roberts Fig.3 result of Sobel
图 4
Prewitt 算子效果 图 5 LoG 算子效果
图 6 Canny 算子效果
Fig.4 result of Prewitt Fig.5 result of LoG Fig.6 result of Canny
55
由图可以看出 Roberts 算子、Sobel 算子、Prewitt 算子的实质都是差分法或微分法,它
们的效果基本类似,都基本检测得到图像中细胞的边缘,也检测出了一些杂质点。其中 Sobel
和 Prewitt 算子的效果几乎完全一样。
LoG 算子结合高斯滤波和 Laplace 边缘检测算子,利用高斯滤波滤除一些噪声,但在滤
除噪声的同时也会滤掉一些边缘点。LoG 算子的模糊量取决于参数σ ,σ 越大,噪声滤波
- 2 -
中国科技论文在线
http://www.paper.edu.cn
60
效果越好,但丢失的边缘信息也越多。图示选取的是σ =1.7,对边缘保留较好,σ 取更大值
时边缘信息有明显丢失存在断裂。
从 Canny 算子的效果可以看出,Canny 算子不仅较好地检测得到边缘,而且利用高斯函
数很好地滤除了噪声。Canny 算子将边缘点连接起来,形成连续的轮廓,这无论在人视觉上
的观察还是之后的自动识别过程中,这都会起着较大的作用。由图示和分析可知,在粪便显
65
微图像的应用中,Canny 算子有比较明显的优势,因此本文选择 Canny 算子进行边缘检测。
1.2 基于阈值的图像分割
基于阈值的分割主要利用目标和背景之间的灰度差异,选择一个或多个阈值,通过判断
每个像素是否满足某个阈值的要求,来确定图像中的像素属于哪个区域[7]。当物体与背景有
较大的反差时,基于阈值的分割特别有效,而且计算简单,总能够用封闭且连通的边界来定
70
义不同的区域。阈值分割的过程相对简单,主要有两步:
① 选取合适的分割阈值。
② 将像素值与阈值进行比较,确定像素所属类别。
目前常用的基于直方图的阈值分割方法,是利用直方图波峰、波谷等处进行分割。。当
只需将图像中像素分为两类时,若图像直方图有两个明显的波峰,选择两峰之间的波谷对应
75
灰度值作为阈值,即可进行分割。
然而与一般的细胞识别所用图像不同,本文中所用细胞显微图像中细胞放大倍数较小,
因此细胞在图像中所占比例小,图像中绝大部分像素属于背景。因此图像的直方图没有呈现
双峰形状,而只有一个非常明显的峰,代表背景像素。因此本文中选择比波峰稍小的一个灰
度值作为阈值,对图像进行二值化,分割细胞和背景。分割效果如图 7。
80
该阈值分割对应阈值比波峰处灰度值小 15。由阈值分割结果图像 8 可以看出,本文中
选择的阈值能够较好地分割目标和背景。
图 7 细胞图像直方图 8 阈值分割结果
Fig.7 histogram of cell photo Fig.8 result of thresholding
85
1.3 边缘检测与阈值法的结合
通过实验发现,在对细胞图像进行灰度化后,分别利用边缘检测和阈值分割进行图像分
割,并进行膨胀、腐蚀和填充孔洞操作,再识别细胞时都会遗漏一些细胞,而对二者的识别
结果取并集,可以提高识别的准确率。另外通过观察细胞图像 R(红)、G(绿)、B(蓝)
- 3 -
中国科技论文在线
http://www.paper.edu.cn
三个通道可以发现,这三个通道分别保留了细胞的不同信息,因此可以将三个通道分别进行
90
边缘检测分割,进而识别细胞。为尽可能提高识别率、同时减少误判,本文将边缘提取和阈
值分割两种方法结合,并且将输入图像的三个颜色通道的信息都加以利用,而不是只对灰度
图像进行操作。
因此,本文在分割阶段分别使用边缘检测和阈值法对图像进行分割得到了多幅分割结
果,在之后的细胞识别过程中可以综合使用。
95
2 红白细胞识别分类
2.1 特征的选择和测量
有大量的特征可以用于细胞分类中,然而在特定的应用中,需要根据不同细胞的特点和
图像的清晰度等,选择合适的特征。特征选择就是从大量的特征中找出一些特征,它们可以
最有效地区别对象。有效的图像特征需要具备独立性、稳定性、可区分性[8]。
100
细胞具有多种特征,本文选择的细胞特征为细胞的面积 S、圆形度 CR 和形状因子 F[9],
这是根据细胞和杂质的连通区域特点选择的。因为细胞一般接近圆形,背景杂质和噪声呈不
规则状,因此可以用这些特征对细胞和杂质加以区分。对于白细胞和红细胞,可以利用面积、
细胞中心处颜色加以区分。
形状因子 F 和圆形度 CR 计算公式如下:
105
其中,L 为连通区域 R 的周长,S 为连通区域 R 的面积。
(1)
(2)
其中,μ 是从连通区域 R 重心到边界点的平均距离,δ 是连通区域 R 重心到边界点的
110
距离的均方差:
是区域重心:
(3)
(4)
(5)
115
当连通区域趋近圆形时,形状因子 F 趋于 1,圆形度 CR 单调递增且趋向无穷,它不受
区域平移、旋转和尺度变化的影响。
2.2 分类算法描述和实现
为了对红细胞和白细胞的各个特征设置合理的阈值,本文实验中对确定属于两种细胞的
细胞进行统计,计算其平均面积、形状因子、圆形度等[10] [11],由此得到特征阈值。通过统
120
计获得红细胞和白细胞的各种属性,具体为红细胞面积范围为 200~750 像素,圆形度范围
1.0~1.8,形状因子范围 5~正无穷;白细胞面积范围为 500~2000 像素,圆形度范围 1.0~2.0,
形状因子范围 3~正无穷。因此设置各个特征对红细胞和白细胞的阈值如表 1:
- 4 -
)**4/()*LFSL(RRRC边界点个数):(),(),(110Rkyxyxkkiii边界点个数):(-),(),(1210RRkyxyxkkiii),yx(RyxRyxySyxS),(),(1,1x
中国科技论文在线
http://www.paper.edu.cn
细胞类别
红细胞
红细胞
白细胞
白细胞
红细胞
白细胞
红、白细胞
表 1 细胞分类阈值
Tab.1 Threshold of cell classification
阈值名称
阈值意义
S_R_1
S_R_2
S_W_1
S_W_2
CR_R
CR_W
F_RW
面积最小值
面积最大值
面积最小值
面积最大值
圆形度最小值
圆形度最小值
形状因子最大值
数值
200
750
500
2000
9
5
1.5
125
分类算法规则如表 2,根据表中分类规则即可对图像中细胞进行识别分类。
表 2 细胞分类规则
Tab.2 rules of cell classification
面积 S
圆形度 Cr 形状因子 F 中心与周围像素灰度差 判定细胞类型
S_R_1 < S < S_W_1 CR > CR_R
F < F_RW
S_W_1 < S < S_R_2 CR > CR_R
F < F_RW
S_W_1 < S < S_R_2 CR > CR_W
F < F_RW
S_R_2 < S < S_W_2 CR > CR_W
F < F_RW
无
正数
负数
无
红细胞
红细胞
白细胞
白细胞
3 实验结果及分析
3.1 算法实现
130
算法流程如图 9。其中分离颜色通道,是将 RGB 彩色图像进行通道分离,对 R(红)、
G(绿)、B(蓝)三个通道分别进行边缘检测,并基于 B(蓝)通道进行阈值分割,作为
细胞分类识别的基础。
本实验在 Windows7 系统中利用 C++语言和 OpenCV 图形库进行开发。OpenCV(Open
Source Computer Vision Library)是一个基于开源发行的跨平台计算机视觉库, OpenCV 由
135
Intel 于 1999 年建立。
3.2 结果分析
算法性能评价标准如下:
(6)
(7)
140
其中,错识细胞个数表示识别得到的红(白)细胞中为白(红)细胞或杂质的目标个数。
漏识个数表示人眼判定为红(白)细胞但没有被识别出的细胞数目。实验结果如表 3。
实际应用中,人工识别计数一幅有 150 个细胞的图最少要 5 分钟。对一幅包含细胞数目
约为 150 个的彩色图像,图像大小为 2048*1536 像素,本实验测得其处理时间平均为 3.5 秒,
图中包含细胞总数约为 150 个。在计算机自动识别之后,只需人工检查即可,大大降低了人
145
的劳动,有一定的实用价值。
- 5 -
识别出的细胞个数错识细胞个数错识率漏识的细胞个数)(识别出细胞个数漏识的细胞个数图中细胞个数漏识的细胞个数漏识率
中国科技论文在线
http://www.paper.edu.cn
150
细胞类型
识别结果
图 9 算法流程图
Fig.9 flow chart of algorithm
表 3 实验结果
Tab.3 experiment results
错识率
错识个数
漏识个数
漏识率
270 个
37 个
4
0
1.5%
0
11
2
3.9%
5.1%
红细胞
白细胞
4 结论
本文在在粪便显微图像的基础上,根据图像中红细胞和白细胞特点,对图像进行分割和
细胞识别。通过实验可知,本算法针对背景颜色较深、细胞与背景反差较小的细胞显微图像
155
有较好的识别效果,且耗时短,能基本满足实际生产需求。下一步工作是研究对粘连细胞的
分割,进一步提高细胞识别准确率。
[参考文献] (References)
160
165
170
[1] 刘斌,曾立波,刘生浩.血液细胞图像自动识别系统的研究[J].计算机工程,2003,29(1):174-175
[2] 姚少波.基于颜色空间的白细胞显微图像分析与算法[D].福州:福建师范大学,2006.
[3] 汤学民. 血液细胞图像自动识别系统的开发[D]. 清华大学硕士论文. 2004.
[4] 高永进.白细胞自动识别系统的研究[D].南京:南京大学,2001.
[5] H. D. Cheng, X. H. Jiang, Y. Sun, J. Wang. Color image segmentation: advances and prospects[J]. Pattern
Recognition, 2001, 34(12):2259-2281.
[6] 张硕,彭冬亮.基于数学形态学的细胞图像分割[J].杭州电子科技大学学报, 2008,12(7):52-55.
[7] 粱 光 明 , 刘 东 华 , 李 波 . 用于 显 微 细 胞 图像 的 二 维 自 适应 阈 值 分 割 算法 的 优 化 [J]. 中 国 图 象 图 形 学
报,2003,7(7):764-769.
[8] Rafael C. Gonzalez, Richard E. Woods 著, 朊秋琦,朊宇智等译. 数字图像处理[M]. 北京: 电子工业出版
社, 2000.
[9] 边肇祺. 模式识别[M]. 北京: 清华大学出版社,1988.
[10] Y.Tanimura. Automatic Classification of White Cells[J]. Medical Imaging Technology,1996,14(1): 14-22.
[11] Vapnic V, Lerner A. Pattern Recognition using Generalized Portrait[J]. Automation and Remote Control,
1963,34:774-780.
- 6 -