76
⦾
2016,52(21)
Computer Engineering and Applications 计算机工程与应用
大数据与云计算
⦾
基于决策树对支持向量机的医学图像分类新方法
邹 丽,蒋 芸,陈 娜,沈 健,胡学伟,李志磊
ZOU Li, JIANG Yun, CHEN Na, SHEN Jian, HU Xuewei, LI Zhilei
西北师范大学 计算机科学与工程学院,兰州 730070
College of Computer Science and Engineering, Northwest Normal University, Lanzhou 730070, China
ZOU Li, JIANG Yun, CHEN Na, et al. New medical image classify approach based on decision tree twin support
vector machine. Computer Engineering and Applications, 2016, 52(21):76-80.
Abstract:Aiming at the fuzzy problem in Multi-class Twin Support Vector Machine(Multi-TWSVM), a new method of
Decision Tree Twin Support Vector Machine based on Genetic Algorithm(GA-DTTSVM)is proposed. GA-DTTSVM
builds the decision tree with the feature data by genetic algorithm to separate the fuzzy region of samples, so that the sam-
ple recognition rate can be improved. For each node of the decision tree this paper uses the Twin Support Vector Machine
(TWSVM)to train a classifier, and finally it uses the trained classifier for classification and prediction. The experiments
show that GA-DTTSVM algorithm can get higher classification accuracy and faster training speed compared with Decision
Tree Twin Support Vector Machine algorithm(DTTSVM)and Multi-TWSVM.
Key words:genetic algorithm; twin support vector machine; classification and prediction
摘 要:针对传统对支持向量机多类分类算法(Multi-TWSVM)中出现的模糊性问题,提出了一种基于遗传算法的决
策树对支持向量机(GA-DTTSVM)多类分类算法。GA-DTTSVM 用遗传算法对特征数据建立决策树,通过构建决
策树可以分离样本的模糊区域,提高模糊区域样本的识别率。在决策树的每个节点上用对支持向量机(TWSVM)训
练分类器,最后用训练的分类器进行分类和预测。实验结果表明,与决策树对支持向量机(DTTSVM)多类分类算法
以及 Multi-TWSVM 相比,GA-DTTSVM 多类分类算法具有较高的分类精度和较快的训练速度。
关键词:遗传算法;对支持向量机;分类和预测
文献标志码:A 中图分类号:TP301
doi:10.3778/j.issn.1002-8331.1501-0387
1 引言
精度[4]。
乳腺癌是严重危害女性身心健康的最常见恶性肿
瘤之一,发病率已居女性恶性肿瘤首位,并且逐年以 3%
的速率递增[1]。临床发现 I 期乳腺癌的五年存活率可达
90% [2],因此早发现、早诊断、早治疗是降低乳腺癌患者
死亡率的重要保障[3]。传统的医学图像分类方法主要依
赖于图像处理技术,无法发现乳腺 X 光医学图像中隐匿
的信息,所以引入高效的数据挖掘算法对乳腺 X 光医学
图像的特征进行挖掘,提高乳腺 X 光医学图像的分类
提高乳腺 X 光医学图像分类精度的关键在于特征
提取和分类器的设计。常见的分类方法如支持向量机
(Support Vector Machine,SVM)[5]是 Vapnik 等人提出的
建立在结构风险最小化与 VC 维基础上的机器学习方
法,由于它能较好地解决小样本、非线性、高维数、局部
极小点等实际问题,近年来被用于许多领域。在支持向
量机的基础上,提出了许多改进算法。例如最小二乘支
持向量机 [6]、近似支持向量机(Proximal Support Vector
基金项目:国家自然科学基金(No.61163036,No.61163039);2012 年度甘肃省高校基本科研业务费专项资金项目;甘肃省高校研究
生导师项目(No.1201-16);西北师范大学第三期知识与创新工程科研骨干项目(No.nwnu-kjcxgc-03-67)。
作者简介:邹丽(1990—),女,硕士研究生,主要研究方向为数据库与数据挖掘,E-mail:zoulispring@163.com;蒋芸(1970—),女,
博士,教授,硕士生导师,主要研究方向为数据挖掘,粗糙集理论及应用;陈娜,沈健,胡学伟,李志磊,硕士研究生。
收稿日期:2015-01-29 修回日期:2015-03-31 文章编号:1002-8331(2016)21-0076-05
CNKI 网络优先出版:2015-07-03, http://www.cnki.net/kcms/detail/11.2127.TP.20150703.1611.027.html
邹 丽,蒋 芸,陈 娜,等:基于决策树对支持向量机的医学图像分类新方法
2016,52(21)
77
Machine,PSVM)[7]、基于广义特征值的多平面近似支持
向 量 机(Generalized Eigenvalues Proximal Support
Vector Machine,GEPSVM)[8] 等 。 源 自 GEPSVM 的 思
想 ,Jayadeva 等 提 出 了 对 支 持 向 量 机(Twin Support
Vector Machine,TWSVM)[9]。 TWSVM 将 训 练 时 间 缩
短为标准 SVM 的 1/4,而且保持了较高的分类精度,适
合大规模数据集的分类。TWSVM 是两类分类器,在对
支持向量机多类分类算法(Multi-TWSVM)[10]中,用传统
的“一对多”方法将 TWSVM 扩展为多类分类器。但是
这种多类分类器在实际应用中存在样本不可分的现象,
产生模糊区域。在决策树对支持向量机(DTTSVM)[11]
多类分类算法中,当类别数目很大时,枚举并计算所有
类之间的距离是困难的。
针对上述问题,本文提出了一种基于遗传算法的决
策树对支持向量机(GA-DTTSVM)多类分类算法。该
算法将决策树和 TWSVM 相结合构造分类器解决多类
分类问题,通过构建决策树解决了 TWSVM 在多类分类
中的模糊性问题。该分类器的性能和决策树的结构有
很大关系,较高的节点对分类器性能有更大的影响,通
过引入遗传算法建立决策树,选择适应度大的节点在决
策树上层,可以减少 DTTSVM 的误差累积,并且利用遗
传算法优良的空间搜索性能,能快速找到全局最优解。
2 基于遗传算法的决策树对支持向量机多类分类器
2.1 遗传算法
遗传算法(Genetic Algorithm,GA)[12]是一种借鉴生
物界自然选择和遗传学原理的进化算法,通过自然选
择、交叉、变异等机制,实现种群进化。在寻优过程中,
GA 在解空间随机产生多个初始点开始并行搜索,由适
应度函数指导搜索方向。遗传算法是一种能够在复杂
搜索空间快速寻求全局最优解的搜索技术,广泛地应用
于函数优化、图像识别以及机器学习等领域。
2.2 对支持向量机
对支持向量机[13]不同于传统的支持向量机,它通过
求解两个规模更小的二次规划问题来获得一对非平行
超平面,使每个二次规划的目标函数对应一个特定的
类,同时其约束条件受另一类样本的影响,并且在此二
次规划问题的约束中仅出现正类或负类样本。
i
给定包含 2类 n 维 l 个训练样本的数据集 T ={(x
)}
Î Rni = 12l 。对于两类分类问题,类别标
´ n 的
表示两类样本的
其中 x
签记为 Y ={+1 -1} 。分别用 l
1
矩阵 B 表示 +1 类和 -1 类,其中 l
1
数目。
´ n 的矩阵 A 和 l
y
i
和 l
2
2
i
TWSVM 的目标是在 n 维空间中寻找两个超平面:
(1)
xTw
1
公式中的 (×)T 表示向量的转置。TWSVM 通过求解
= 0xTw
+ b
1
+ b
= 0
2
2
下面两个凸规划问题以获得两个分类超平面。
第 l 类超平面优化准则为:
b
1
2 + C
1
1
min
eT
2
2
b
ξ
w
1
1
ξ 0
s.t. -Bw
2
1
第 2 类超平面优化准则为:
+ e
1
+ ξ e
Aw
1
+ e
b
1
2
ξ
1
min
2
b
ξ
w
2
2
s.t. -Aw
和 C
Bw
2
+ e
2
b
2 + C
eT
2
2
1
+ ξ e
ξ 0
1
(2)
ξ
2
2
b
+ e
1
2
是惩罚因子,ξ 为松弛变量,e
1
(3)
其中 C
为适
1
当维数的单位列向量。式(2)中第一个式子说明所得到
的分类超平面聚集在+1 类数据点附近,第二个式子是
其约束条件,式(3)有相同的性质。
和 e
2
在求解式(2)和式(3)两个优化问题时,TWSVM 引
入 Lagrange 乘子,下面仅给出式(2)的推导,式(3)的推
导类似:
b
L(w
1
1
ξαβ) = 1
Aw
2
1
αT(-Bw
1
+ e
1
+ e
b
1
ξ -
2 + C
eT
1
2
+ ξ - e
) - βTξ (4)
其中 α 和 β 是 Lagrange 乘子。通过二次规划最优问题
的 KKT 条件和式(4),得到式(2)的对偶问题:
b
1
2
2
α
eT
2
max
αTG(H T H )-1G Tα
α - 1
2
s.t. 0 α C
1
]G =[B e
式(5)中 H =[A e
1
解得 w
1
解 w
和 b
超平面近,就可以判定其类别。判别公式为:
(5)
] 。通过求解对偶问题式(5),
,得到式(2)的解。同理也可得到式(3)的
和 b
1
。那么对于新的样本点,只要求出其离哪个
2
2
2
f (x) = arg min
i = 12
|
i
| xTw
i
+ b
w
i
(6)
2.3 基于遗传算法的决策树对支持向量机多类
分类算法
决策树中上层节点对分类器性能有更大的影响,越
接近根节点的位置越容易出现错分,其误差积累现象越
严重。因此在生成决策树的过程中必须使每个节点上
某一类和其他类能最大程度地分离。通过遗传算法选
择、交叉、变异等机制,选择在初始类中能最大程度分离
的两类作为根节点,每次把多类聚合为两类,求两类中
心间的最大距离建立决策树的每个节点。在 K 类分类
问题中,有 2K - 1 - 1 种组合将多类聚合为两类,当 K 很
大时枚举所有的组合并计算它们之间的距离是困难的,
但是利用遗传算法能在复杂搜索空间快速寻求全局最
优解的特点,可以快速求得最优解。因此将遗传算法引
入到建立决策树过程中,提出基于遗传算法的决策树对
支持向量机多类分类算法。
GA-DTTSVM 多 类 分 类 算 法 主 要 过 程 分 为 两 步 。
第一步用遗传算法建立决策树,第二步用 TWSVM 训练
78
2016,52(21)
Computer Engineering and Applications 计算机工程与应用
决策树。算法具体描述过程如下。
第一步用遗传算法建立决策树:
给 出 包 含 m 类 样 本 的 数 据 集 D ={(x
y
i
i
)} (i = 1
y
2l) ,类标为 Y ={y
1
y
2
} 。
m
(1)population = InitPopulation( pSizemD) ;/*设置
种群大小 pSize 和染色体长度 m ,从样本数据集 D 中随
机选择 pSize 个样本放入初始种群 population 中,采用
标准二进制编码方法对染色体编码。*/
(2) fitness = CalFitValue( population) ;/* 染 色 体 表
中,
中,用 K-means 聚类算法
示多类的聚集状态,基因值为“1”的样本聚合到 X
1
基因值为“0”的样本聚合到 X
2
分别求 X
1
和 X
2
的中心。聚类中心表示为 C
= 1
l
k
k
l
k
å
i = 1
xk
i
k
Î X
(i = 12l
其中 xk
i
数。适应度函数是 X
1
fitness =
。*/
- C
k
)l
和 X
C
1
2
(k = 12) 表示 X
之间的欧氏距离,定义为
的样本个
k
k
2
(3)[bestChrbestFit] = Sort( fitnesspSize) ;/*用快速
排序法对染色体的适应度降序排列,保存并返回最佳适
应度和其对应的染色体。*/
(4)SelectionOperator( populationpSize) ;/*选 择 操
作通过轮盘赌选择算法,从前一代种群中选择优良个体
到下一代种群中,具有较高适应度的染色体被选中的概
率较大。*/
(5)CrossoverOperator( populationpSize) ;/*交叉操
作是通过交叉算子对任意两个染色体交换部分信息形
成新的染色体放入下一代种群中。*/
(6)MutationOperator( populationpSize) ;/* 变 异 操
作是通过变异算子改变单个染色体的某个位置上的基
因值。*/
(7)[cbestChrcbestFit] = GA( pSizemgSize);/* gSize
为迭代次数,搜寻最优解过程:
步骤 1 通过(1)初始化种群。
步骤 2 当控制变量 g 小于 gSize 时,通过(2)计算
种群中每个染色体的适应度值,通过(3)得到种群的最
佳适应度值和其对应的染色体,通过选择、交叉和变异
遗传操作产生下一代种群。将每次迭代得到 bestFit 中
最大的 bestFit 存入 cbestFit 。
步骤 3 返回最优适应度 cbestFit 及其对应的最优
染色体。*/
(8)[L
t
] = BuildTree(cbestChroD) ;/* 通 过 解 码 操
作,将最优染色体中基因值为“0”的所有样本聚合为一
类,基因值为“1”的所有样本聚合为另一类,形成第一次
= A
划分 L
的测
t
试。再将 A
分别作为初始群体通过(7)求最优染
色体,寻找下一个划分,产生下一个决策树节点,直到 A
。决策树的根节点是对 A
B
t
和 B
和 B
t
t
t
t
t
t
的都为两类分类问题,则停止,此时 A
和 B
别为叶子节点。*/
t
和 B
t
t
的类
第二步用 TWSVM 训练决策树:
输入 原始样本数据集 D ;
输出 分类结果 Y 。
(1)[traintest] = GetTrain(D) ;/* 从 D 中 随 机 选 取
一定比例的数据作为训练样本集 train ,剩余部分作为
测试样本集 test */
t
(2)[L
] = BuildTree(cbestChrotrain) ;/* 用 第 一 步
中的方法在训练集 train 上建立决策树,得到每个节点
上样本的划分 L
*/
t
t
b
t
(3)[w
FunPara) ;/*训练阶段,在
] = TWSVM(L
t
决策树节点所对应的划分 L
上,通过求解对偶问题,解
得 w
b
t
(4)Y = Predict(test) ;/*测试阶段,在每个决策节点
,得到每个节点上的分类超平面。*/
t
t
上通过公式(6)判定测试样本点的类别。*/
3 实验及分析
为了验证 GA-DTTSVM 的分类性能,在 UCI 数据集
和医学图像上进行测试。实验运行环境:Windows XP
操 作 系 统 ,CPU 主 频 2.10 GHz,内 存 为 2 GB,Matlab
7.11.0 软件。
3.1 UCI 数据集上的实验
在公开的 UCI 机器学习标准数据集上选取 Iris 数据
集、Wine 数据集以及 Glass 数据集,数据集概况如表 1
所示。
表 1 数据集概况
数据集
类别
属性
总样本
训练样本
测试样本
Iris
Wine
Glass
3
3
6
4
13
13
150
178
214
120
142
171
30
36
43
以 Iris 数据集为例说明分类过程。Iris 数据集以鸢
尾花特征作为数据来源,包含三种花 setosa、versicolor
和 virginica(分别用 B1,B2,B3 表示)。按照 2.3 节中的
步骤,对 Iris 数据集用遗传算法建立决策树,建立的决策
树结构如图 1 所示。将 B2 与 B3 两类合并为一类和 B1
类构造分类器 TWSVM1-23 分离出 B1 类,然后对 B2 类和
B3 类构造分类器 TWSVM2-3分离出 B2 类和 B3 类。
TWSVM
1 - 23
B1
TWSVM
2 - 3
B2
B3
图 1
Iris 数据集建立的决策树
邹 丽,蒋 芸,陈 娜,等:基于决策树对支持向量机的医学图像分类新方法
2016,52(21)
79
用 Iris 数据集中的 30 个测试样本对分类器性能进
行测试,分类精度最高达到 98.27%。用同样的方法对
Wine 数据集和 Glass 数据集做实验,分类精度分别达到
93.65%和 97.08%。
3.2 医学图像上的实验
医 学 图 像 上 的 分 类 实 验 所 用 数 据 集 是 MIAS(the
Mammographic Image Analysis Society)[14],它 是 研 究
乳腺 X 光图像的标准数据集,图像均为 1 024×1 024 的
灰度图。数据集包含 322 幅乳腺 X 光图像,它们分属于
三类:正常、良性和恶性。其中,属正常的图像 208 幅、
良性 63 幅和恶性 51 幅。
首先对 MIAS 数据集中的图像做预处理。主要有
二个步骤:
第一步:图像去噪。由于这些图像是在不同外部条
件下获取的,包含大量有噪声的背景。因此,首先将图
像裁剪为 500 ´ 750,去除部分无用的背景信息。然后用
具有保持边界功能的中值滤波方法对图像去噪,去噪后
的图像如图 2(b)所示。
第二步:图像增强。数据集中的图像一些亮度很
高,而另一些却太暗。实验中用直方图均衡化方法增强
图像,避免图像过亮或过暗而影响分类效果。图 2(c)是
图像增强后的效果。
(a)原始图像 (b)剪切去噪后的图像 (c)增强后的图像
图 2 预处理后的图像效果对比
对处理后的图像提取特征。本实验采用的特征提
取方法是灰度共生矩阵 [15],提取了四种统计参数:角二
阶矩、熵、惯性矩、相关系数,灰度共生矩阵的方向取 0°,
45°,90°,135°四个方向。首先计算四个方向上的灰度
共生矩阵,取像素间距离为 1,其次由每个灰度共生矩阵
计算四个统计参数。把每幅图像分成四块,对每块子图
像提取上述 16 个特征作为原始样本数据,共获得 64 个
统计特征。
用 GA-DTTSVM 对提取的特征数据做分类。按照
2.3 节中的步骤对特征数据建立决策树,建立的决策树
结构如图 3 所示,其中 D1、D2 和 D3 分别表示正常、良性
和恶性。对特征数据集进行 10 次随机抽样,选择其中
80%做训练,其余 20%做测试,做 10 组仿真实验,实验结
果如表 2 所示,可以看出最高分类精度为 83.71%。
采用 10 层交叉验证方法和网格搜索方法在特征数
据集上进行参数寻优。GA-DTTSVM 所用的核函数为
径向基核函数(Radial Basis Function,RBF),定义如下:
TWSVM
13 - 2
TWSVM
1 - 3
D2
D1
D3
图 3 MIAS 数据集建立的决策树
表 2 本文算法在 MIAS 数据集上的分类效果
组号
分类精度/%
组号
分类精度/%
1
2
3
4
5
82.65
82.93
79.89
83.71
81.78
6
7
8
9
10
83.49
82.84
80.97
81.96
83.57
k(xy) = exp(-
x - y 2
2σ 2
)
其中,σ 2 是核参数。
(7)
C
需要优化的参数为惩罚因子 C 和核参数 σ 2 。对 C
和 σ 2 划 分 网 格 搜 索 ,划 分 间 隔 为 1,参 数 选 择 范 围 为
2-2~22 。每次用 10 层交叉验证方法计算分类精度,选择
分类精度最高时的参数 C 和 σ 2 。从图 3 中看出必须训
= 1.25
练两个 TWSVM,得到两组最优参数,第一组:C
1
= 1.25 σ 2 = 0.25 即图 3 中 TWSVM13-2 的参数( C
和
是对支持向量机中两个超平面的惩罚因子),第二
C
= 3.25 σ 2 = 1.25 即 图 3 中 TWSVM1-3
组 :C
1
的参数。用最优参数做分类实验,得到最高分类精度
87.49%,分类精度有了明显的提升。
3.3 实验结果分析
= 1.25C
1
2
2
2
将本文提出的算法与文献[11]中的决策树对支持向
量机多类分类算法(DTTSVM)和对支持向量机多类分
类算法(Multi-TWSVM)作对比。本文算法通过引入遗
传算法构建决策树,使决策树的每层节点上的类之间具
有最大分离度,减少了误差累积,并且利用遗传算法优
良的搜索能力,可以快速建立决策树。而 DTTSVM 通
过穷举法计算每两类之间的距离建树,当类别数目很多
时,建树时间过长,并且构建的决策树结构固定,不适合
推 广 。 用 10 层 交 叉 验 证 方 法 对 Iris、Wine、Glass 以 及
MIAS 四种不同的数据集分别进行 10 次随机抽样,选择
其中 80%做训练,其余 20%做测试,做 10 组仿真实验,
所得平均分类精度如表 3 所示。
表 3 三种算法 10 组实验平均分类精度 %
GA-DTTSVM
Multi-TWSVM
DTTSVM
数据集
Iris
Wine
Glass
MIAS
95.73
84.45
94.42
74.62
96.16
87.24
93.77
76.33
96.32
90.41
95.06
82.37
80
2016,52(21)
Computer Engineering and Applications 计算机工程与应用
图 4 表示三种算法 10 组实验平均分类精度对比。
可以清楚地看出在四种不同数据集上 GA-DTTSVM 的
分类精度要高于 Multi-TWSVM 和 DTTSVM 的分类精
度,在 MIAS 数据集上表现得更加明显。
100
95
90
85
80
75
70
/
%
度
精
类
分
均
平
Multi-DTSVM
DTTSVM
GA-DTTSVM
Iris
Wine
Glass
MIAS
数据集
图 4 三种算法 10 组实验平均分类精度对比
表 4 表示三种算法在四种数据集上的最高分类精
度,可以看出,在 MIAS 数据集上 GA-DTTSVM 的分类
精度相比 Multi-TWSVM 和 DTTSVM 分别高出 10.97%
和 8.31%,获得了较好的分类效果。
表 4 三种算法在四种数据集上的最高分类精度
%
GA-DTTSVM
Multi-TWSVM
数据集
DTTSVM
Iris
Wine
Glass
MIAS
96.85
89.36
96.54
76.52
97.43
91.75
95.21
79.18
98.27
93.65
97.08
87.49
图 5 表示三种算法 10 组实验平均训练时间对比。
可以看出相比 Multi-TWSVM 和 DTTSVM,GA-DTTSVM
有较好的速度优势,训练时间较短。
0.20
0.16
0.12
0.08
0.04
0
s
/
间
时
练
训
Multi-DTSVM
DTTSVM
GA-DTTSVM
Iris
Wine
Glass
MIAS
数据集
图 5 三种算法 10 组实验平均训练时间对比
通过以上分析可以看出,GA-DTTSVM 无论在分类
精度还是在训练速度上都取得了较好的效果,对于医学
图像的分类有很好的应用前景。
4 结束语
本文提出了一种基于遗传算法的决策树对支持向
量机多类分类算法,并将其应用于三种 UCI 数据集以及
乳腺 X 光医学图像标准数据集 MIAS 的分类中。将该
算法和 DTTSVM 以及 Multi-TWSVM 作对比,实验结果
表明该算法不仅保持了较高的分类精度,而且在训练速
度上体现出一定优势,具有一定的实用价值。在医学图
像分类中,GA-DTTSVM 多类分类算法的性能与特征提
取的好坏有很大关系,今后将进一步研究图像特征提取
方法来提高算法分类精度。
参考文献:
[1] 王希龙,邱文秀,贾中明,等.乳腺癌的诊断现状及最新进
展[J].中国综合临床,2012,28(8):787-788.
[2] Lo C S,Wang C M.Support vector machine for breast
MR image classification[J].Computers and Mathematics
with Applications,2012,64(5):1153-1162.
[3] Nishikawa R M.Current status and future directions of
computer-aided diagnosis in mammography[J].Computer-
ized Medical Imaging and Graphics,2007,31(4):224-235.
[4] 王一澎,陈国际.隐匿性乳腺癌的诊断及治疗[J].中国医刊,
2008,43(3):35-37.
[5] Vapnik V N.The nature of statistical
New York:Springer Verlag,1995:4-80.
learning theory[M].
[6] Suykens J A K,Vandewalle J,de Moor B.Optimal con-
trol by least squares support vector machines[J].Neural
Networks,2001,14(1):23-35.
[7] Fung G,Mangasarian O L.Proximal support vector machine
classifiers[C]//Proceedings of
the Seventh ACM SIGKDD
International Conference on Knowledge Discovery and
Data Mining,2001:77-86.
[8] Mangasarian O,Wild E.Multisurface proximal
support
vector machine classification via generalized eigenvalues[J].
IEEE Transactions on Pattern Analysis and Machine
Intelligence,2006,28(1):69-74.
[9] Jayadeva,Khemchandai R,Chandra S.Twin support vec-
tor machines for pattern classification[J].IEEE Transac-
tions on Pattern Analysis
Intelligence
(TPAMI),2007,29(5):905-910.
and Machine
[10] Cong H,Yang C,Pu X.Efficient speaker
recognition
based on multi-class twin support vector machines and
GMMs[C]//2008 IEEE Conference on Robotics,Auto-
mation and Mechatronics,2008:348-352.
[11] Shao Y H,Chen W J,Huang W B,et al.The best sepa-
rating decision tree twin support vector machine for
multi-class classification[J].Procedia Computer Science,
2013,17:1032-1038.
[12] Wang Q,Chen H,Shen Y.Decision tree support vector
machine based on genetic algorithm for fault diagnosis[C]//
IEEE International Conference on Automation and Logis-
tics,ICAL 2008,2008:2668-2672.
[13] 刘凯.双支持向量机的改进及其应用[D].兰州:兰州大学,
2013.
[14] The mammographic image analysis
society[EB/OL].
[2014-11-10].http://www.wiau.man.ac.uk/services/MIAS/
MIASweb.html.
[15] Manivannan K,Aggarwal P,Devabhaktuni V,et al.Par-
ticulate matter characterization by gray level co-occur-
rence matrix based support vector machines[J].Journal
of Hazardous Materials,2012,223:94-103.