Computer Engineering and Applications 计算机工程与应用
2018,54(15)
203
粪便镜检图像中红白细胞的分割与识别方法
蒋先刚,何晓岭,范自柱
JIANG Xiangang, HE Xiaoling, FAN Zizhu
华东交通大学 理学院,南昌 330013
School of Science, East China Jiaotong University, Nanchang 330013, China
JIANG Xiangang, HE Xiaoling, FAN Zizhu. Methods of segmentation and recognition for red and white cells in
stool microscopy images. Computer Engineering and Applications, 2018, 54(15):203-208.
Abstract:In allusion to recognition method for the red and white cells with vague boundary in the stool microscopy images,
this paper proposes a new method based on Chan-Vese model, which considers both the edge and texture information of
neighboring regions. It proposes a synergetic combination 8 direction Sobel edge enhancement with the tensor field as the
region texture attribute in order to remedy the clear cell’s fuzzy boundary and keep the cell’s inherent texture. The com-
plementary edge and texture is more suitable for the Chan-Vese segmentation model considering global and local energy
distribution. It also takes the random decision forest with better data generalization effect as a classification tool. The experi-
mental results show that the improved Chan- Vese segmentation method considering both boundary and domain texture
makes the segmentation accuracy of red and white cells in the stool microscopy images up to 95.3% . This method has
higher recognition precision and strong universality for tangible object in stool microscopy images.
Key words:stool microscopy images; image segmentation; structure tensor; Chan-Vese model; random decision forest
摘 要:针对粪便镜检图像中具有弱边界的红、白细胞的识别问题,研究了基于 Chan-Vese 模型的兼顾邻域区域边缘
和纹理综合信息的分割方法。用八向 Sobel 弥补透明细胞的模糊边缘,通过细胞域内纹理和边缘信息互补而采用兼
顾全局和局部能量分布的 Chan-Vese 模型的分割方法,并采用具备更好的数据泛化作用的随机决策森林进行分类。
实验证明,提出的兼顾边界与域内纹理的改进型 Chan-Vese 分割方法使粪便镜检图像中红、白细胞的分割精度达到
了 95.3%。该方法对粪便镜检图像中的有形物体具备更高的分辨能力和光学环境适应性。
关键词:粪便镜检图像 ;图像分割 ;结构张量 ;Chan-Vese 模型 ;随机决策森林
文献标志码:A 中图分类号:TP391.41
doi:10.3778/j.issn.1002-8331.1704-0015
1 引言
粪便镜检图像分析是指通过对粪便中各种有形物
的光学影像分析,来检验一个人的内消化系统是否有疾
病、损伤和潜在病灶。粪便镜检图像中的有形物体具有
比尿沉渣图像中的有形物体更复杂的背景和模糊的边界,
在国内对粪便镜检图像的分析仍然主要依靠人工目检。
基于边缘的图像分割考虑的是局部图像的梯度变
化,边缘检测通过确定灰度值的突变点来区分不同的区
域,但是局部区域的弱边界使边缘检测方法往往不能获
取完整的有形物区域 [1]。对于复杂背景的粪便镜检图
像,白细胞的胞核不清楚,胞浆呈颗粒状,红细胞呈现为
双圆环结构,红白细胞的边缘比较模糊,单独采用阈值
分割和边缘分割方法不能兼顾所有有形物体的分割[2]。
红白细胞的透明性使以能量平衡为主要分割思想的
Chan-Vese 分割模型仍然不能有效分割出红白细胞区
域,需要研究基于 Chan-Vese 模型的兼顾边缘加强和纹
理属性保留的信息互补的分割方法,在对有形物体分割
的基础上,基于随机决策森林的分类方法具备良好的数
据泛化作用,对粪便镜检图像的分类具备更强的鲁棒性。
2 红白细胞的分割方法
可利用多向 Sobel 算子求取图像的梯度边缘而得到
基金项目:国家自然科学基金(No.61262031,No.61263032)。
作者简介:蒋先刚(1958—),男,教授,研究领域为图像处理、模式识别,E-mail:jxg_2@tom.com;何晓岭(1991—),通讯作者,女,硕
士研究生,研究领域为图像处理、模式识别;范自柱(1975—),男,博士,副教授,研究领域为模式识别与机器学习、图像处理。
收稿日期:2017-04-01 修回日期:2017-06-12 文章编号:1002-8331(2018)15-0203-06
CNKI 网络出版:2017-08-24, http://kns.cnki.net/kcms/detail/11.2127.TP.20170824.0959.038.html
计算机工程与应用www.ceaj.org
204
2018,54(15)
Computer Engineering and Applications 计算机工程与应用
分割区域,或者用迭代法或大津法直接得到二值区域,
再结合各种形态学而获得比较规整的有形物体区域,但
考虑到粪便镜检图像的特点,需采用对模糊边界区域分
割的自适应性比较强的方法,包括高低阈值自适应的
Canny 边缘检测和基于 Chan-Vese 模型的分割方法。
2.1 高低阈值自适应的 Canny 边缘检测
高低阈值自适应 Canny 边缘检测的主要思路是将
经过非模极大值抑制后的梯度幅值分为 L 级,将模极大
值分成三类 C2,C1,C0
[3]。设定 ni 为模数为 i 的像素的
总数,pi 为该模级像素数占整个图像像素的比率:pi =
ni
N ,∑
L - 1Pi = 1 ,pi ≥ 0 ,设 C0 包含模级为 [1,2,⋯,k] 的
像素,C1 包含模级为 [k + 1,k + 2,⋯,m] 的像素,则 C2 包
含模级为 [m + 1,m + 2,⋯,L - 1] 的像素,如设总像素梯
度幅值的期望为:
i = 0
μT = ∑
L - 1ipi
i = 0
则三类点的对比率和类内期望为:
k pi,μ0 =
i = 0
ì
ï
ï
w0 = ∑
ï
ï
ïï
ï
ï
ï
ï
w1 = ∑
í
ï
ï
ï
ï
ïï
ï
ï
w2 = ∑
ï
ï
î
i = k + 1
i = m + 1
∑
k ipi
i = 0
w0
∑
m ipi
i = k + 1
w1
∑
l - 1 ipi
i = m + 1
w2
m pi,μ1 =
l - 1 pi,μ2 =
(1)
(2)
各类类内方差为:
k
∑
m
i = 0
∑
ì
ï
ï
ï
σ 2
0 =
ïï
ï
ï
ï
í
σ 2
1 =
ï
ï
ï
ïï
ï
ï
σ 2
2 =
ï
î
通过对类内方差取得最大而确定双阈值的评价函
(i - μ0)2 pi
w0
(i - μ1)2 pi
w1
(i - μ2)2 pi
w2
∑
i = m + 1
i = k + 1
l - 1
(3)
数为:
σ2(k,m) = ∑
2
j = 0
(μj - μT)2wj
(4)
由此求解得到的 m ,k 即为自适应的 Canny 边缘检测的
最佳高低阈值参数[4]。对这两个阈值取对应于最大抑制
和边缘跟踪时的比例权重,γ1,γ2 为不同的参数时可得
到不同的边缘分割效果,图 1 为对尿液镜检图取不同权
重参数下自适应高低阈值的 Canny 边缘检测效果,随着
这些参数的增加,细弱的边缘将被放弃。通过空洞填充
等形态学处理将能分割出红、白细胞区域,但对如图 1
左上方模糊边界的有形物体,无论边缘权重参数取多大
的范围,仍不能勾勒出完整的圆形区域[5-6],对于具备更
多模糊边界和透明细胞壁的红白细胞的粪便镜检图像
需借助于与区域内外属性有别的分割模型。
(a)原图
(b)γ1 = 0.3,γ2 = 0.08
(c)γ1 = 0.6,γ2 = 0.1
(d)γ1 = 1.6,γ2 = 0.3
图 1 取不同权重参数下自适应的 Canny 边缘检测效果
2.2 基于 Chan-Vese 模型的分割
2001 年 Chan 和 Vese 提出了简化 M-S 的分割模型,
即 Chan-Vese 分割模型[7],它设原图 I(x,y) 被活动轮廓 c
划分为目标 wa 和背景 wb 两个区域,设这两个区域的
平均灰度分别为 ca 和 cb ,Chan 和 Vese 提出简化 M-S
图像分割模型的拟合能量函数如下:
|
2dxdy +
| I - ca
F(c) = Fa(c) + Fb(c) = ∫
inside(c)
|
2dxdy
| I - cb
∫
outside(c)
(5)
式中,c 是表示分割区域的闭合轮廓线;ca 、cb 是依赖
于 c 的两个常数。很显然,只有当闭合活动轮廓线 c 位
于两个同质区域的边界时,函数 F(c) 才能达到最小值。
据此,Chan 和 Vese 提出了如下的图像分割能量函数:
F(c,ca,cb) = μL(c) + νs0(c) + λa∫
| I - ca
|
2dxdy +
inside(c)
λb∫
| I - cb
|
2dxdy
outside(c)
(6)
式中,L(c) 为闭合轮廓 c 的长度;νs0(c) 是 c 的内部区域
面积;实参数 μ、ν ≥ 0 ;λa、λb > 0 是函数各项的权重系数。
通过优化 F(c,ca,cb) 就可以求得最终分割曲线以及
区域内外平均灰度值 ca 、cb ,而且由此保证分割的结果
是最优的。由于此模型利用了图像的全局信息,因此
通过最优化能量函数可以得到全局优化的图像分割
结果[8-9]。
设 ϕ0 是根据初始化轮廓线 c0 构造的符号距离函数
(Signed Distance Function,SDF),即 {
}
c0|ϕ0(x,y) = 0 ,
并令 ϕ0(inside(c)) > 0 ,ϕ0(outside(c)) < 0 。可以证明,以
水平集函数表达的轮廓线 c 的长度和轮廓内部的面积
分别为:
计算机工程与应用www.ceaj.org
蒋先刚,何晓岭,范自柱:粪便镜检图像中红白细胞的分割与识别方法
2018,54(15)
205
δ(ϕ)
|∇ϕ dxdy
|
(7)
|∇H 2dxdy = ∫
L(c) = ∫
|
S[inside(c)] = ∫
Ω
Ω
Ω
H(ϕ)dxdy
(8)
式中的 Ω 是水平集函数的定义域,Heavisdie 函数 H(ϕ)
表示如下:
1,ϕ ≥ 0
H(ϕ) = ì
í
0,ϕ < 0
î
(9)
Dirac 函数 δ(ϕ) 是取 Heaviside 函数 H(ϕ) 的导数,
故水平集函数 ϕ 可表示为:
|∇ϕ dxdy + ν∫
|
Ω
|
2H(ϕ)dxdy +
2[
|
1 - H(ϕ) dxdy
F(ϕ,ca,cb) = μ∫
λa∫
λb∫
δ(ϕ)
| I - ca
| I - cb
]
Ω
Ω
Ω
H(ϕ)dxdy +
(10)
Chan 和 Vese 用欧拉-拉格朗日方法推导出求解式,
并采用梯度下降法,得到 Chan-Vese 模型的水平集演化
方程为:
∂ϕ
∂t = δ(ϕ)[μ∇
- ν - λa(i(x,y) - ca)2 +
Ω
∇ϕ
|
|∇ϕ
λb(i(x,y) - cb)2]
∫
I(x,y)Hs(ϕ)dxdy
∫
I(x,y)[
∫
ì
ï
ï
ï
ï
ïï
ï
ï
ï
ï
ca =
í
ï
ï
ï
ï
ïï
cb =
ï
ï
ï
ï
ϕ(0,x,y) = ϕ0(x,y)
î
]
[
1 - Hs(ϕ) dxdy
Hs(ϕ)dxdy
∫
]
Ω
Ω
Ω
1 - Hs(ϕ) dxdy
(11)
其中,Hs(ϕ) = 1
2
é
1 - 2
ê
ë
π arctan(
ϕ
ù
ε ) δs(ϕ) = 1
ú
π
û
ε
ε2 + ϕ2
,ε 为常数。
由于红、白细胞灰度值区域分布的不均匀性,将同
时考虑边缘与灰度值空间分布的纹理属性作为最优化
能量函数对象,将获得更适应图像状态的分割。如果根
据对图像中每个像素不同方向的求导表示纹理的方向
信息,用它们的组合代表结构张量来进行基于纹理的分
割[10],将结构张量定义为高斯平滑算子 Kp 和图像梯度
的卷积:
Tp = Kp∗(∇I∇I T) =
Kp∗I 2
Kp∗I
x Kp∗2Ix IY
Kp∗I 2
y
æ
çç
è
ö
÷÷
ø
(12)
采用计算 Tp 各个分量总和的均值作为纹理图像的
均值,则有:
T = (Tp(11) + Tp(12) + Tp(21) + Tp(22)) 4
(13)
这样使用纹理均值 T 图像代替原来的灰度图像 I ,
公式(10)转变为公式(14),则基于 Chan-Vese 模型的张
量场的最小化能量函数表示为:
Ω
F(ϕ,Ta,Tb) = μ∫
λa∫
λb∫
|∇ϕ dxdy + ν∫
|
|
2H(ϕ)dxdy +
2[
|
1 - H(ϕ) dxdy
δ(ϕ)
|T - Ta
|T - Tb
]
Ω
Ω
Ω
H(ϕ)dxdy +
(14)
公式(14)中的 Ta 和 Tb 与公式(10)中的 ca 、cb 类似,表
示每次水平集更新迭代过程中域内和域外的平均张
量。实验中,μ 是约束周长几何的参数,ν 是约束面积
几何的参数,λa,λb 是约束区域内部和背景的几何参
数[11]。图 2 是将欲分割区域属性增强的比较,图 2(b)是
原图经高斯过滤的效果如公式(13)中的 Tp(12) ,图 2(c)
是各向梯度图像经高斯处理的效果如公式(13)中的
Tp(11),Tp(21),Tp(22) 综合效果,图 2(d)是 Tp(11),Tp(12),
Tp(21),Tp(22) 共同融合效果,此时图像的背景更加平滑均
匀,以暗黑色为分割目标区域,以浅灰色为背景的颜色块
聚群更加明显,这更有利于Chan-Vese的分割模型的构造。
(a)灰色图像
(b)高斯后灰度
(c)高斯后各向边缘
(d)融合张量 T
图 2 灰度图像及各种增强属性的比较
取灰度、边缘、张量等属性或它们的组合作为 Chan-
Vese 能量平衡模型分割区域会得到不同的分割效果。
图 3 是基于 Chan-Vese 模型而采用不同属性和参数对粪
便镜检图像进行分割的效果比较。图 3(b)中采用原图
灰度为属性的 Chan-Vese 分割将无法分割出有形物区
域,以已兼容边缘和域中灰度分布的金标准图像为参考
进行规定化处理后的图像灰度为属性的 Chan-Vese 分割
也能得到较好的分割效果,但图 3(d)采用 Sobel 边缘为
属性的 Chan-Vese 分割基本能分割出有形物区域,但会
产生过多的边缘噪声,红白细胞的透明部分仍不能得到
有效分割,而图 3(h)以张量属性表示的 Chan-Vese 分割
模型能有效分割出有形物且不会带出更多的边缘噪声
杂点,分割的区域更加均匀饱满。参数的不同选择将按
参数的意义分割出强调周长、面积、面积周长比和区域
与背景的属性比例关系的分割效果。
综合比对各种经典的分割方法,对粪便镜检图像采
用各种边缘和区域分割的效果比较如图 4 所示。其中
图 4(a)为一幅粪便镜检图像,由于图像中红、白细胞中
含透明的胞核等,这样在它们的边缘存在与背景非常相
近的纹理和颜色,属于弱边界或部分无边界的状态,
图 4(b)是采用多向 Sobel 边缘加强取得的效果,虽然兼
顾了各个方向的梯度变化,这种以边缘特性为对象的滤
波方法仍然无法处理部分非常弱的边界,图 4(c)是双阈
计算机工程与应用www.ceaj.org
206
2018,54(15)
Computer Engineering and Applications 计算机工程与应用
(a)原图
(b)灰度值,μ = 1.2,v = 1.0,
(c)灰度值,μ = 0.8,v = 1.2,
(d)Sobel,μ = 1.0,v = 1.0,
λa = 0.4,λb = 0.6
λa = 0.8,λb = 1.2
λa = 0.8,λb = 1.0
(e)Sobel,μ = 0.8,v = 2.0,
(f)规定化灰度值,μ = 0.8,
λa = 0.8,λb = 1.0
v = 0, λa = 0.8,λb = 1.2
(g)纹理,μ = 0.8,v = 1.0,
(h)纹理,μ = 0.8,v = 2.2,
λa = 0.8,λb = 1.2
λa = 0.8,λb = 1.0
图 3 基于 Chan-Vese 模型取不同属性和参数的分割效果比较
值 Canny 分割的结果,虽然对正常态的红、白细胞有较
好的圆形区域边界探测效果,但仍然存在分割后圆形细
胞不闭合的轮廓,对弱边界物体区域的分割仍然缺乏鲁
棒性,图 4(d)是直接用迭代法阈值分割的镜检图像,这
是基于图像灰度分布而自动选择阈值而进行的分割,这
只适应类似尿液镜检图像的分割,图 4(e),图 4(f)是采
用 Chan-Vese 和改进型 Chan-Vese 模型而进行的分割,
这主要依据分割的内部区域和外部区域的能量平衡方
程而进行的区域调整和划分,这种方法更注重图像的全
局信息,适应于边界模糊或无边界区域的分割,改进型
Chan-Vese 模型更注重圆形区域内部和边界的融合信
息,使分割的红、白细胞连通域更加具备几何区域的完
整性。图 4 中的分割图像将继续经过腐蚀、膨胀、开运
算、闭运算、空洞填充和杂质消除等形态学处理方法而
得到更规整的区域划分。依据粪便镜检图像中分割后
目标区域像素数与实际目标区域像素数之比来衡量,采
用双阈值 Canny 的分割率为 74%,迭代法阈值的分割率
为 72%,Chan-Vese 的分割率为 80%,改进型 Chan-Vese
的分割率为 86%。
3 特征提取与组合
粪便镜检图像中的红、白细胞具备一定的特异性,
将红、白细胞进行有效的分类识别,需在完成红、白细胞
的分割以后,进一步提取两种细胞的各自特征。表 1 是
将图像按 1 024×768 尺寸缩放,且处理的图像按金标准
图像进行规定化处理后,对拟选择的红、白细胞、植物纤
维和脂肪滴等有形物体的几何、灰度分布和纹理特征的
相关描述和范围,作为对比分析需要,表中数据进行了
量纲规一处理,在对图像的纹理特征计算时,以计算方
向 θ = 0° 的灰度共生矩阵为主,取相隔像元距离 d 为 3,
灰度层次为 8。
表 1 中的 pi(x,y) 表示灰度在 0~255 级出现的概率,
(a)原图
(b)多向 Sobel 边缘加强
(c)双阈值 Canny 分割
(d)迭代法阈值分割
(e)Chan-Vese 分割 (f)改进型 Chan-Vese 分割
图 4 对粪便镜检图像进行分割的效果比较
p(i,j|d,θ) 表示相隔像元距离为 d ,方向为 θ 时共现灰度
i 和 j 的概率。“相关”特征计算中的 μx,μy,σx,σy 为在
X、Y 方向的相关计算参数。实验证明表中的各种特征
有重复表达和对正确分类贡献不大的特征,采用 Relief
和遗传算法可去除与分类不太相关的特征,保留对红、
白细胞等区域的正确判断起到关键作用的特异性特
征。利用 Relief 算法为各个几何、灰度统计和纹理特征
赋予分类贡献的权重,根据权重的大小选出更有利于
分 类 的 特 征 ,实 验 中 采 用 的 特 征 组 合 为 Φ1 :Φ1 =
[S L C G R E H I LS]T 。
4 分类效率分析和实验比较
4.1 随机决策森林在镜检图像分类中的应用
由 Leo Breiman 和 Adele Cutler 提出的随机森林分
计算机工程与应用www.ceaj.org
蒋先刚,何晓岭,范自柱:粪便镜检图像中红白细胞的分割与识别方法
2018,54(15)
207
表 1 红、白细胞等有形物体的特征计算及特征分布范围
类别
面积
周长
圆形度
平均灰度
平滑度
三阶矩
能量
熵
相关
惯性矩
局部稳定
计算公式
S = n
L = ∑
n edge
S = 1
C = 4πS/L2
G = ∑
255 ipi(x,y)
i = 0
R = 1/(1 + σ2)
255
μ3 = ∑
E(d,θ) = ∑
i = 0
(1 - G)3 p(x,y)
{p(i,j|d,θ)}2
H(d,θ) = -∑
C(d,θ) = ∑
i,j
i,j
i,j
{p(i,j|d,θ)}2 - lb{p(i,j|d,θ)}
(i - μx)( j - μy)p(i,j|d,θ)/σxσy
I(d,θ) = ∑(i,j)2 p(i,j|d,θ)
LS(d,θ) = ∑
i∑
j
i
j
1
1 +(i + j)2
p(i,j|d,θ)
红细胞
白细胞
植物纤维
680~1 150
900~2 260
50~180
90~250
140~460
40~80
1.0~1.6
1.0~1.9
1.8~3.6
80~180
90~210
92~210
79~90
80~140
52~173
0.01~0.19
0.08~0.43
0.12~0.53
0.27~0.61
0.18~0.42
0.22~0.38
1.5~1.9
1.5~2.5
1.4~2.4
0.31~0.6
0.2~4.4
0.4~0.7
0.10~0.42
0.19~0.83
0.13~0.63
0.6~1.4
0.23~0.46
0.33~0.49
}
类算法,结合了 Breimans 的 Bootstrap 聚合思想和 Ho 的
随机子空间方法,其实质是构建一个树型分类器的集合
{
h(x,θk),k = 1,2,⋯,n [12-13]。每棵树的训练样本和采用的
特征小集合都采用了随机的方法,形成的每棵决策树之
间不存在关联[14],每一棵树构成的输入样本都不是全部
的样本而不容易出现过拟合现象,且从总的 M 个特征
中随机选择 m 个子集对每一棵决策树进行学习,这样
构成的不同训练条件下的随机森林决策模型对测试数
据具备广泛的适应性和精确归类。
图 5 列出采用不同训练特征数和森林树棵数对应
的识别误差曲线,总的特征组合为 M = 9 ,在构造每棵
数时,选择不同训练特征子集数量 m 时,决策森林树分
类真阳性率会不同。训练过程中采用非常少的特征的
组合,如采用 m =(1~3)/9 × M 比采用适当的特征组合
m = (4~6)/9 × M 的决策森林具备较差的分类效果,由
过少的特征组合训练将产生过于简单的随机决策森林
树,而过少的特征数分集将使决策边界的位置不能正确
地被确定[15]。过少的训练特征使得需选择更多的树的
棵数才能达到最小识别误差。采用如 m =(8~9)/9 × M
等会产生过大的网络,由于随机性小而产生的决策森林
差
误
类
分
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
训练特征数 m =(6/9)M
训练特征数 m =(1/9)M
训练特征数 m =(8/9)M
30
60
90 120 150 180 210 240 270 300
随机树的棵数
图 5 不同训练特征数和森林树棵数与分类误差关系
也没在最佳状态。同时决策树的棵数对分类的精确性
也有较大的影响,决策树的数量在选择 87 棵左右时取
得最低的识别误差,决策树数量的进一步增加将增加计
算时间且还不能使识别精度有大的提高。
4.2 分类实验比较与分析
尿沉渣和粪便镜检图像分析系统的软件开发环境
为 Delphi 7,主机采用 I7-3770 CPU,主频 3.40 GHz,内
存为 8 GB。实验的图像来自相关分析化验诊室。实验
和测试图片的规整尺寸分辨率为 1 024×768,训练图像
数为 600 幅,测试图像数为 200 幅,考虑到细节分析的需
要,实验中采用的粪便镜检图像为截取的部分区域块
图,所有图片为未染色显微图片,检测的红细胞用蓝色
圈定,白细胞用白色圈定,而其他有形物用绿蓝色标
定。图 6(a)为对尿液镜检图像的分类处理过程,由于该
类图的背景纹理比较同质且有形物体的边缘比较清晰,
采用双阈值 Canny 分割基本上从背景中提取了有形物
体所占区域的边缘,用改进型 Chan-Vese 模型则完全抠
取了有形物体所占区域,通过随机决策森林基本上对红
白细胞等进行了精确的识别。图 6(b)为对粪便镜检图
像的分类处理过程,由于该类图的背景复杂且有形物的
边界比较模糊,背景上还包含许多暗黑模糊区域,且红、
白细胞的部分胞壁是透明的,细胞周围存在模糊边界或
无边界现象,采用过大权重的双阈值 Canny 分割以加强
透明区域的边缘,必然引入许多杂乱的边缘,使边缘交
错严重而仍无法正确提取有形物的区域,而用改进型
Chan-Vese 模型分割则兼顾了邻近区域边缘和纹理的综
合信息而使红白细胞得到有效的分割,左上部分的半圆
区域通过链码差的分析而修补成完整圆区域,在有效分
割的基础上,通过形态学处理和区域链码描述得到对应
的有形物区域特征,再用特征组合 Φ1 作为随机森林决
计算机工程与应用www.ceaj.org
208
2018,54(15)
Computer Engineering and Applications 计算机工程与应用
尿沉渣原图
双阈值 Canny 分割
改进型 Chan-Vese 分割
RF 分类结果
(a)尿液镜检图像的分类处理过程
粪便镜检原图
双阈值 Canny 分割
改进型 Chan-Vese 分割
RF 分类结果
(b)粪便镜检图像的分类处理过程
图 6 对尿液和粪便镜检图像进行分割和识别的过程比较
策的测试样本输入参数而得到红、白细胞的正确分类。
作为分析比较,各种分类方法的检测精确度如表 2 所
示,由于 RF 的数据泛化能力使粪便镜检图像红白细胞
的误检率明显减少。
表 2 各种分类方法对红白细胞检测精确度比较
%
尿液镜检图像
粪便镜检图像
分类方法
正检率
误检率
正检率
误检率
Bayes
BP 神经网络
RF
90.3
91.4
95.3
5.2
3.7
2.9
93.1
95.7
97.2
3.6
2.9
2.1
5 结束语
本文结合粪便镜检图像有形物边界难以用一般分
割方法抠取的特点,采用高斯分布的张量描述有形物区
域的综合属性,调整随机决策森林方法中合理的特征子
集组合、决策森林训练特征数及决策树的数量的合理选
择使随机决策森林的分类效果明显提高。对粪便镜检
图像的红、白细胞分割精度达到了 95.3%。对尿沉渣图
像的有形物的识别精度达到了 97.2%,实验结果表明,
基于全局统计属性的 Chan-Vese 分割模型与随机决策森
林的数据泛化能力的结合能有效提升对粪便镜检图像
中有形物的辨别和分类精度。进一步的研究将采用深
度学习的方法构建粪便镜检图像中红白细胞的模型与
分类机制。
参考文献:
[1] Tchiotsop D,Tchinda B S.Edge detection of intestinal
parasites in stool microscopic images using multi-scale
wavelet transform[J].Signal,Image and Video Processing,
2015,9(1):121-134.
[2] Chien T I,Kao J T,Liu H L,et al.Urine sediment exami-
nation:a comparison of automated urinalysis
systems
and manual microscopy[J].Clinica Chimica Acta,2007,
384(1/2):28-34.
[3] 白渊海 . 尿沉渣图像红白细胞自动分割与识别算法研究[J].
现代电子技术,2013(17):118-121.
[4] 唐路路,张启灿,胡松 . 一种自适应阈值的 Canny 边缘检测
算法[J]. 光电工程,2011,38(5):127-132.
[5] 黄梓效 . 尿沉渣显微图像中红细胞分割识别方法研究[D].
长沙:湖南大学,2009.
[6] Redondo R,Bueno G,Chung F,et al.Pollen segmenta-
tion and feature evaluation for automatic classification
in bright- field microscopy[J].Computers and Electronics
in Agriculture,2015,110(C):56-69.
[7] Vese L A,Chan T F.A multiphase level set framework
for image segmentation using the Mumford-Shah model[J].
International Journal of Computer Vision,2002,50(3):
271-293.
[8] Dirami A,Hammouche K,Diaf M,et al.Fast multilevel
thresholding for
image segmentation through a multi-
phase level set method[J].Signal Processing,2013,93(1):
139-153.
[9] Getreuer P.Chan- Vese segmentation[J].Image Processing
On Line,2012,2:214-224.
[10] 陈国一 . 基于模糊聚类的粪便镜检图像识别研究[D]. 西
安:西安工业大学,2014.
[11] Breiman L.Random forest[J].Machine Learning,2001,45
(1):5-32.
[12] Bosch A,Zisserman A,Munoz X.Image classification
using random forests and ferns[C]//Proceedings of the
11th IEEE International Conference on Computer Vision,
2007:1-8.
[13] 曹正凤 . 随机森林算法优化研究[D]. 北京:首都经济贸易
大学,2014.
[14] 向涛,李涛,李旭冬,等 . 基于随机森林的层次行人检测算
法[J]. 计算机应用研究,2015,32(7):2196-2199.
[15] Schroff F,Criminisi A,Zisserman A.Object class seg-
mentation using random forests[C]//Proc of the British
Machine Vision Conference,2010.
计算机工程与应用www.ceaj.org