logo资料库

论文研究-一种面向非平衡步态数据的帕金森病诊断方法.pdf

第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
资料共6页,全文预览结束
218 2018,54(9) Computer Engineering and Applications 计算机工程与应用 一种面向非平衡步态数据的帕金森病诊断方法 吴 玺 1,张 永 2,陈 绪 2,许胜强 3,王 训 4 WU Xi1, ZHANG Yong2, CHEN Xu2, XU Shengqiang3, WANG Xun4 1. 合肥工业大学 计算机与信息学院,合肥 230009 2. 合肥工业大学 工业与装备技术研究院,合肥 230009 3. 中国科学院 合肥智能机械研究所,合肥 230031 4. 安徽中医药大学 神经病学研究所附属医院,合肥 230061 1.School of Computer and Information, Hefei University of Technology, Hefei 230009, China 2.Institute of Industry & Equipment Technology, Hefei University of Technology, Hefei 230009, China 3.Institute of Intelligent Machines, Chinese Academy of Sciences, Hefei 230031, China 4.Hospital Affiliated to Institute of Neurology, Anhui University of Chinese Medicine, Hefei 230061, China WU Xi, ZHANG Yong, CHEN Xu, et al. Diagnostic approach of Parkinson’s disease for imbalanced gait data. Computer Engineering and Applications, 2018, 54(9):218-223. Abstract:Dyskinesia is the significant feature of Parkinson’s disease patient, therefore the data analysis on parkinsonian gait kinematic parameters can provide a strong basis for disease diagnosis and rehabilitation. The actual number of Parkin- son’s disease is far less than the normal human. The traditional machine learning methods are not suitable to classify the imbalanced data directly. This paper proposes a Cost Sensitive Support Vector Machine(CS- SVM)approach to distin- guish between healthy human and patients with Parkinson’s disease firstly. The entire subject’s gait data is extracted from real U-shape electronic walkway. The classification performance is also improved by transforming the extracting features into non-dimensional forms. The experimental results indicate that the CS-SVM method can achieve the prediction accuracy of 94.16%, and the F-measure value reaches 87.08%, while it achieves a better performance comparing traditional SVM and the recognition performance is significantly improved by eliminating the influence of height, the prediction accuracy and F-measure value reach 94.81% and 88.66% respectively. Key words:gait analysis; imbalanced data; electronic walkway system; Parkinson’s disease; Cost Sensitive Support Vector Machine(CS-SVM) 摘 要:运动障碍是帕金森病(PD)患者的重要特征,步态信号分析可以为疾病诊断和康复治疗提供有力依据。现实 中 PD 患者数量远小于正常人群,传统的机器学习方法不适合对正例样本数远多于反例的非平衡数据进行分类。为 了准确地区分出 PD 患者和健康人,使用一种代价敏感支持向量机(CS-SVM)的方法来构建 PD 患者和健康人之间的 步态信号分类模型。所有受试者的步态运动学特征数据是采用真实的 U 型电子步道系统提取的,并将特征数据转 化为无量纲的形式来消除身高对时空属性的影响。实验结果表明使用这种 CS-SVM 方法得到的预测准确率和 F-measure 值分别达到了 94.16%和 87.08%,与传统的 SVM 方法相比性能更优。同时消除身高对时空属性的影响可 以大幅提高识别性能,预测准确率和 F-measure 值分别达到 94.81%和 88.66%。 关键词:步态分析 ;非平衡数据 ;电子步道系统 ;帕金森病 ;代价敏感支持向量机 文献标志码:A 中图分类号:TP391 doi:10.3778/j.issn.1002-8331.1612-0225 基金项目:国家高等学校学科创新引智计划(“111”)(No.B14025);(佛山市科技创新团队资助)可穿戴设备研发创新团队 (No.2015IT100095);广东省科技厅重大项目(No.2016B010108002);安徽省科技攻关计划项目(No.1501021042, No.1301042215)。 作者简介:吴玺,博士,研究方向为信号处理与系统、机器学习,E-mail:wuxi_xizi@sina.com;张永,硕士;陈绪,硕士;许胜强,博士; 王训,教授。 收稿日期:2016-12-14 修回日期:2017-02-06 文章编号:1002-8331(2018)09-0218-06 CNKI 网络出版:2017-05-10, http://kns.cnki.net/kcms/detail/11.2127.TP.20170510.1116.014.html 计算机工程与应用www.ceaj.org
吴 玺,张 永,陈 绪,等:一种面向非平衡步态数据的帕金森病诊断方法 2018,54(9) 219 1 引言 帕金森病(PD)是一种锥体外系疾病,也称为运动 障碍疾病,主要症状表现为运动迟缓、肌僵直、静止性震 颤和姿势不稳。帕金森病造成的运动障碍往往会呈现 一种特殊的步态特征,如拖步、慌张步态和步态冻结 等[1-2]。临床诊断中,医生通常利用上述步态特征作为帕 金森病的诊断线索,因此对帕金森病患者的步态信号特 征进行分析可以为疾病前期诊断和康复治疗提供有力 的依据。 早期帕金森病诊断通常采用量表形式,如帕金森病 统一评分量表(UPDRS)和 Weber’s 分级量表[3],这种量 表通过设计针对性的动作和问题对患者的步态等特征 进行直接观察,并对各项指标进行主观评分。这种诊断 方式主观性强,依赖于医生经验,诊断的准确性和稳定 性不高[4]。 近年来机器学习技术的发展,为步态信号定性和定 量的分析提供了重要的手段[5-6]。如 Begg 等人[7]采用支 持向量机自动识别年龄与步态特征之间的变化规律,其 使用了三种类型的步态变量:基本时空参数、运动属性 和动力学属性。当人正常行走时,使用一种同步 PEAK 运动分析系统和一个平台记录并分析 12 位年轻人和 12 位老年人的步态信息。Klucken 等人[8]运用一种基于可 移动的、嵌入生物传感器的人工智能步态分析(eGaIT) 系统对帕金森病患者的患病阶段和运动状态进行自动 识别。上述研究中分别选择帕金森病患者和老年人组 与具有相似物理特征的对照组作为训练集,并且所选择 的正、反两类样本大小基本相同,属于平衡样本数据分 析。但是在帕金森病的监测中,帕金森病患者的数量远 少于健康人群,因此实际中获得的样本为非平衡数据样 本,并且将帕金森病患者判别为健康人的代价和将健康 人判别为帕金森病患者的代价不同,前者导致延误治疗 的最佳时机甚至危害生命,而后者以再次检查或药物副 作用为代价,显然将帕金森病患者判定为健康人群的代 价更大,因此使用平衡样本学习到的模型不能解决实际 问题。 本文的研究目的是针对由帕金森病患者和正常人 群组成的非平衡步态数据集,应用机器学习的方法构建 识别模型,然后应用该识别模型来区分帕金森病患者和 正常人群,从而为临床医生诊断疾病提供客观依据。研 究过程是首先由 U 型电子步道提取出真实的帕金森病 患者和健康人群的各种步态时空参数,并将上述步态时 空参数和受试者的物理特征构建出非平衡特征数据样 本,然后采用一种代价敏感支持向量机(CS-SVM)的方 法来处理非平衡样本数据,建立自动识别帕金森病患者 的分类模型。同时利用受试者的身高对相应样本的步 态信号时空属性进行去量纲处理来消除身高差异对步 态信号时空属性的影响,从而达到进一步提高预测模型 识别性能的目的。研究结果表明,本文构建的模型可以 对帕金森病进行自动诊断,可以作为临床医生对帕金森 病患者诊断的有效辅助工具。 2 材料和方法 2.1 数据获取和特征 本文使用一套由中国科学院合肥智能机械研究 所运动与健康信息技术研究中心自主设计研发的电 子步道,该电子步道由基于柔性阵列力敏传感器的 14 块 压 力垫(大小 60 cm×60 cm,4 压力点/cm2,采样频率 100 Hz)、5 块 压 力 台(大 小 60 cm × 60 cm,采 样 频 率 500 Hz)以及 1 块平衡测试仪组成,如图 1 所示。图 1(a) 是该 U 型电子步道的结构模拟图,图 1(b)是 U 型电子步 道的实物图。 6 0 c m 60 cm 柔性阵列压力垫 压力台 注:1. 路径两侧安装有护栏 2. 最后一块为人体平衡测试仪 平衡测试仪 图 1(a) U 型电子步道模拟图 图 1(b) U 型电子步道实物图 所有受试的帕金森病患者是来自安徽中医药大学 神经病学研究所附属医院的志愿者。对照测试人员没 有未知的影响步态的损伤或异常,受试者 24 h 内未服用 药物。所有受试者签订了知情同意书。35 位患者和 119 位正常人被要求以正常步速行走在电子步道上,同 时所有受试者的测试均在两位医生的监督下完成。受 试者的物理特征如表 1 所示。依据由美国加利福尼亚 州 Rancho LosAmigos(RLA)医学中心提出的步态量化 参数以及量表 UPDRS- ,利用 U 型电子步道系统提取 直行部分的步态特征数据,如表 2 所示。 Ⅲ 表 1 测试者物理特征(均值±标准差) 变量 年龄(yrs) 性别(m∶f) 体重/kg 身高/cm PD 组(35) 64.86±9.92 NP 组(119) 56.93±8.71 17∶18 38∶81 63.80±12.74 160.20±7.90 61.90±11.22 161.08±8.44 注:m=male;f=female;yrs=years。 计算机工程与应用www.ceaj.org
220 2018,54(9) Computer Engineering and Applications 计算机工程与应用 表 2 提取的特征变量 特征类型(数量) 特征(单位) 时空特征(16) 步长*(cm)、步幅*(cm)、步速*(m · s-1)、步频* (step·s-1)、站立时间*(ms)、摆动时间*(ms)、摆 动前期时间*(ms)、周期(ms)、双支撑时间(ms) 注:标记*的特征均分为左脚特征和右脚特征。 2.2 数据预处理 对步态特征数据的预处理过程主要分为两步:消除 身高差异对时空参数的影响和特征数据的标准化。 (1)消除身高差异对时空参数的影响 通常人行走时的步长、步幅、步速、周期等步态信号 特征和身高都有一定关联。例如身高比较矮的人,其步 长和步幅会相对比较短,而其步频会相对比较高。因此 为了消除受试者身高差异对于步态时空参数的影响,本 文利用下列公式消除身高差异对时空参数的影响。 l̂ = l/l0 v̂ = v gl0 f g/l0 t l0/g f̂ = t̂ = (1) (2) (3) (4) 公式(1)~(4)中,l 表示步长和步幅;t 表示时间特征,包 括站立时间、摆动时间、摆动前期、周期、双支撑时间;f 表示步频;v 表示步速;l0 表示每位受试者的身高;同时 引入一个重力加速度常量 g =9.81 m/s2来消除身高差异 对步速、步频以及时间属性的影响。 (2)标准化 在应用分类器前,将步骤(1)处理后的特征和物理 特征利用式(5)将每一特征转化为相同的统计分布。 x - μ x̂ = σ (5) 式(5)中,x 表示步骤(1)获得的特征变量和物理特征, μ 和 σ 分别表示每个特征变量的均值和标准差。 2.3 分类方法 支持向量机(SVM)是由 Vapnik 提出的一种基于统 计学理论的用于解决分类和回归问题的机器学习方 法[9]。对于二分类问题,SVM 分类算法的主要目标是寻 找一个最优分类超平面。SVM 是通过最大化两类之间 的边界距离来寻找最优超平面。假设存在一个两类的 训练样本空间 Rn ,其中包含样例 xi ∈ Rn,i = 1,2,…,n, 和一个与样例 xi 一一对应的向量 yi ∈ Rn,yi ∈ {1, - 1} 。 SVM 解决分类问题需要优化下式[10-11]: min 1 2  w 2 + C∑ n ξi i = 1 s.t. yi[(wT xi) + b] ≥ 1 - ξi i = 1,2,…,n ξi ≥ 0 (6) 式(6)中 C 是误差的惩罚参数,其取值大于 0。此外,还 需要选择一个核函数,将原样本中线性不可分的低维空 间特征向量映射到一个高维空间中,使样本线性可分。 本文选择普遍使用的径向基核函数(RBF): K(xi,xj) = exp(-γ  xi - xj 公式(7)中 γ 是核函数参数。 2) (7) 上述传统的 SVM 算法是以分类精度为优化目标, 假定每类样本的大小基本相同。但是,在实际中,数据 集通常是非平衡数据。例如帕金森病患者的数量是远 少于正常人群。例如在 100 人的测试样本中有 99 位正 常人,仅有 1 位为帕金森病患者。若分类器把所有样本 都 划 分 为 正 常 人 ,此 分 类 器 能 够 获 得 99% 的 分 类 精 度[12]。虽然分类精度很高,但是使用这种分类模型来识 别帕金森病患者是没有意义的。在诊断过程中,将帕金 森患病者误诊为正常人的代价和将正常人误诊为帕金 森病患者的代价是不同的。前者使帕金森病患者失去 治疗机会,造成病情恶化甚至危及生命,而后者以再次 诊断或药物的副作用为代价。显然,将帕金森病患者判 定为正常人的误分类代价要远大于将正常人判定为帕 金病患者。因此,传统的 SVM 算法不适合处理这种非 平衡数据。 本文中采集的受试者步态数据集为非平衡数据 集。传统 SVM 对此类非平衡数据集学习的边界会更接 近于正例(样本量较少的类),从而导致分类精度倾向于 样本量较大的类,因而需要使用一种有偏的支持向量机 对步态数据集进行分类,将分类边界“拖离”正例。为了 准确区分帕金森病患者和正常人群,本文使用 CS-SVM 来构建帕金森病患者和正常人群的步态分类模型。采 用的 CS-SVM 算法原理是对传统的 SVM 的目标函数做 出修改,即正例和反例设置不同的惩罚参数,分别表示 为 C+ 和 C- 。CS-SVM 的目标函数如下[13-14]: min 1 2  w 2 + C+ ∑ ξi + C- ∑ ξi i:yi = 1 i:yi = -1 s.t. yi[(wT xi) + b] ≥ 1 - ξi i = 1,2,…,n ξi ≥ 0 (8) CS-SVM 算法对正例和反例设置不同的惩罚参数 来处理非平衡数据集,这样就可以将分类超平面“拖离” 正例,然后调整两类的惩罚参数和核函数参数来优化公 式(8)从而获得最优的分类超平面。 2.4 评价指标 在二分类问题中,分类器标签分为正例和反例。分 类器的结果可以表示为混淆矩阵或一致性表[15],用于评 价像支持向量机(SVM)、代价敏感支持向量机(CS-SVM) 和 k 阶近邻(KNN)这样的监督学习算法的性能。表 3 给出的是帕金森病患者预测的混淆矩阵,其中 TP 表示 真实为帕金森病患者,预测也为帕金森病患者的样例个 数;FP 表示真实为健康人群,而预测为帕金森病患者的 样例个数;FN 表示真实为帕金森病患者,而预测为健康 计算机工程与应用www.ceaj.org
吴 玺,张 永,陈 绪,等:一种面向非平衡步态数据的帕金森病诊断方法 2018,54(9) 221 人群的样例个数;TN 表示真实为健康人群,预测也为健 康人群的样例个数。 表 3 帕金森病预测的混淆矩阵 预测类别 帕金森病患者 健康人群 真实类别 帕金森病患者 健康人群 TP FN FP TN 为了评估构建的帕金森病预测模型的性能,本文使 用下列指标。 (1)准确率(Accuracy): Accuracy = TP + TN TP + FP + FN + TN × 100% (9) 公式(9)为准确率的计算公式,表示正确分类的整 体准确率。由此式本文计算的是正确分类的帕金森病 患者和健康人群的样例个数与总样例个数的比值。 (2)召回率(Recall): Recall = TP TP + FN × 100% (10) 式(10)为召回率的计算公式,表示被正确判定的正 例占总体正例的比例。由此式本文计算的是正确分类 的帕金森病患者样例个数与总的帕金森病患者样例个 数的比值。 (3)精确度(Precision): Precision = TP TP + FP × 100% (11) 公式(11)为精确度的计算公式,表示被分类器判定 的正例中真正的正例样本所占的比例。由此式本文计 算的是正确分类的帕金森病患者样例个数与全部预测 为帕金森病患者样例个数的比值。 (4)F-measure 值: F - measure = 2 × Precision × Recall Precision + Recall (12) 式(12)为 F-measure 值的计算公式,表示召回率和 精确度的加权调和平均数。F-measure 值表示召回率和 精确度的综合评价指标,当 F-measure 值越高,则说明分 类实验方法更加有效。 3 实验评估 3.1 实验设置 本研究实验设置为两部分:步态特征差异性检验和 分类实验。在 3.2 节给出利用 T-test 检验帕金森病患者 和正常人群之间步态特征的差异性及分析;3.3 节给出 分类实验结果及评价。在分类实验中分为两组实验,实 验 1:未采用 2.2 节步骤(1)介绍的方法消除身高差异对 时空参数的影响;实验 2:采用 2.2 节步骤(1)介绍的方法 来消除身高差异对时空参数影响。对于每组实验使用 三折交叉验证来对比验证 SVM 和 CS-SVM 两种方法的 识别性能,同时对比两组实验的分类效果。步态数据集 被分为大小相同的三个子集。其中一个子集用于评估模 型,其余子集用于分类器模型的训练和参数优化。然后 计算 2.4 节给出的准确率、召回率、精确度和 F-measure 四种评估指标的均值和标准差来评价构建的预测模型。 在 2.3 节分类方法中介绍到本文使用的算法 SVM 算法需要设置惩罚参数 C 和核函数参数 g ,而 CS-SVM 算法需要设置惩罚参数 C+、C- 和核函数 g 。本文中SVM 算法的参数为:C =4,g =0.031 3;CS-SVM 算法的参数 为:C+ =13.6、C- =3.4、g =0.25。 3.2 实验结果及评价 表 4 给出帕金森病患者和正常人群的步态参数之 间的统计及差异性检验,图 2 给出比较两组步态参数均 值的对比。 表 4 步态特征统计(均值±标准差) 步态特征 步长#/cm 步幅#/cm 步速#/(m·s-1) 步频#/(step·s-1) 站立时间#/ms 摆动时间#/ms 摆动前期时间#/ms 步长*/cm 步幅*/cm 步速*/(m·s-1) 步频*/(step·s-1) 站立时间*/ms 摆动时间*/ms 摆动前期时间*/ms 周期/ms 双支撑时间/ms 帕金森病组 42.19±11.09 81.91±23.56 0.71±0.24 0.83±0.13 835.33±217.47 398.48±47.54 207.49±114.70 41.87±10.89 83.34±22.89 0.72±0.25 0.86±0.12 对照组 56.74±7.12 112.76±14.15 0.99±0.17 0.88±0.11 712.91±111.48 429.71±50.24 132.08±36.93 56.74±7.48 113.78±14.34 1.02±0.18 0.92±0.10 789.94±191.69 400.26±51.29 195.47±101.67 1 204.88±203.91 402.95±211.53 695.78±118.28 420.46±40.90 131.18±41.64 1 135.19±159.34 263.24±77.01 p-value <0.01 <0.01 <0.01 0.03 <0.01 <0.01 <0.01 <0.01 <0.01 <0.01 0.03 <0.01 0.02 <0.01 0.03 <0.01 95%CI [12.33,18.77] [24.51,37.21] [0.22,0.37] [0.004,0.09] [-176.58,-68.25] [12.38,50.09] [-99.44,-51.37] [11.69,18.05] [24.12,36.76] [0.23,0.38] [0.004,0.08] [-146.62,-41.67] [3.69,36.70] [-87.26,-41.31] [-134.40,-4.99] [-185.62,-93.76] 注:标记为#表示为左脚时空特征;标记为*表示为右脚时空。 计算机工程与应用www.ceaj.org
222 2018,54(9) Computer Engineering and Applications 计算机工程与应用 1 500 1 250 1 000 750 500 250 0 / s m 值 均 PD NP LTST LTS W LTPS RTST 步态参数 RTS W RTPS T G C T D S 120 100 80 60 40 20 0 m c / 值 均 PD NP LSL LSTL RSL 步态参数 RSTL 图 2(a) PD 和 NP 组的时间参数均值对比 从表 4 中发现帕金森病患者的步态参数:步长、步 幅、步速、左脚摆动时间、摆动前期时间以及双支撑时间 与正常人群的相应步态时空参数具有显著的差异(p- value<0.01),并且步频、站立时间、右脚摆动时间、周期 也具有显著差异(p-value<0.05)。从图 2 中也可以看出 提取的 PD 和 NP 组的长度和时间参数均值均具有明显 的差异。因此实验中使用 U 型电子步道系统采集的帕 金森病患者和正常人群的步态特征具有显著性差异,所 以提取的步态特征是合理的,能够用于区分帕金森病患 者和正常人群。图 2(a)中 LTST、LTSW、LTPS、RTST、 RTSW、RTPS、TGC、TDS 分别表示左脚站立时间、左脚 摆动时间、左脚摆动前期、右脚摆动时间、右脚站立时 间、右脚摆动前期、周期、双支撑时间;图 2(b)中 LSL、 LSTL、RSL、RSTL 分别表示左脚步长、左脚步幅、右脚 步长、右脚步幅。 表 5 对未消除身高差异影响的样本,使用 SVM 和 CS-SVM 的预测结果(均值±标准差) 算法 SVM CS-SVM 准确率 召回率 精确度 91.55±3.01 94.16±1.96 68.69±3.50 85.86±9.41 93.33±11.55 89.83±10.76 % F-measure 78.98±5.81 87.08±3.36 表 6 对消除身高差异影响的样本,使用 SVM 和 CS-SVM 的预测结果(均值±标准差) 算法 SVM CS-SVM 准确率 召回率 精确度 92.85±4.10 94.81±2.98 71.71±12.08 88.89±12.73 95.83±7.22 90.08±10.80 % F-measure 81.90±10.53 88.66±6.08 3.3 分类及评价 表 5 和表 6 给出实验 1 和实验 2 的分类结果。 实验 1 结果分析:从表 5 中可以看出,针对未消除身 高差异对步态特征影响的样本进行识别时,SVM 和 CS- SVM 分类器的识别准确率分别达到 91.55%和 94.16%, 相比 SVM 模型,使用 CS-SVM 构建分类器的识别准确 率更高,提高了约 2.61%;召回率也更高,达到 85.86%, 提高了约 17.17%,因此 CS-SVM 分类器对帕金森病患 者的步态特征的识别效果更好。 实验 2 结果分析:从表 6 中可以看出,对消除身高差 异对步态特征影响的样本,SVM 和 CS-SVM 分类器的 识别准确率分别达到 92.85%、94.81%。CS-SVM 分类器 图 2(b) PD 和 NP 组的长度参数均值对比 的识别准确率相比于 SVM 分类器提高了约 1.96%;CS- SVM 的召回率达到了 88.89%,比 SVM 分类器提高了约 17.18%,因此相比 SVM 算法,CS-SVM 算法构建的步态 模型对帕金森病患者的误分类率降低了 17.18%,对帕 金森病患者的误判风险降低;同时 CS-SVM 分类器的 F-measure 值达到 88.66%,明显高于 SVM 分类器,约提 高 6.76%。因此,综合考虑识别准确率、召回率和 F-mea- sure 值,相比于 SVM 分类算法,CS-SVM 分类器对帕金 森病患者的步态特征识别性能更好。 对比表 5 和表 6 可以看出,当消除受试者身高差异 对步态时空特征影响时,SVM 和 CS-SVM 分类器的识 别准确率分别为 92.85%和 94.81%,相比于未消除身高 差异对时空属性影响时,SVM 和 CS-SVM 算法对帕金 森病患者和正常人群的步态分类准确率分别提高了约 1.3%和 0.65%;而且相比于未消除身高差异对步态特征 影响时,针对消除受试者身高对步态特征影响的样本, SVM 算法的召回率达到 71.71%,提高了约 3.02%,SVM 算法对帕金森病患者的误分类率降低了 3.02%,SVM 分 类器对帕金森病患者的误判风险降低;同时 F-measure 值达到 81.90%,提高了约 2.92%。CS-SVM 算法的召回 率达到 88.89%,提高了约 3.03%,CS-SVM 算法对帕金 病患者步态特征的误分类率降低了 3.03%,CS-SVM 分 类器对帕金病患者的误判风险降低,而且 CS-SVM 分类 器的 F-measure 值达到 88.66%,提高了约 1.58%。因此 综合考虑识别准确率、召回率和 F-measure 值,相比于未 消除身高差异对步态特征影响的样本实验,通过消除身 高差异对步态特征的影响可以大幅提高帕金森病患者 的识别性能。 4 结束语 本文采用自主研发的 U 型电子步道系统提取帕金 森病患者和健康人群的步态信号时空特征,同时结合受 试者的物理特征组成非平衡步态数据集,并利用 T 检验 验证 PD 患者和健康人群步态特征的差异性和合理性, 然后采用代价敏感支持向量机(CS-SVM)和传统支持 向量机(SVM)分别来构建帕金森病患者和健康人群的 步态特征分类模型,最后通过受试者的身高对步态特征 进行去量纲处理,来消除身高差异对步态特征的影响, 计算机工程与应用www.ceaj.org
吴 玺,张 永,陈 绪,等:一种面向非平衡步态数据的帕金森病诊断方法 2018,54(9) 223 达到了提高预测模型识别性能的目的。实验结果表明, 相比于 SVM 算法,CS-SVM 算法对于帕金森病患者的 步态特征的识别性能更优且能达到 94.16%的全局预测 准确率,有效地降低了帕金森病的误判风险。并且消除 了身高的差异性对步态特征的影响后,CS-SVM 预测模 型的全局识别准确率达到 94.81%,相比不去量纲的预 测模型,预测准确率提高了约 0.65%。因此本文基于 U 型电子步道系统提取的非平衡步态信号数据并采用 CS-SVM 算法构建的预测模型可以为临床医生诊断帕 金森病提供一个可靠的辅助决策工具。 参考文献: [1] Taktak A F G.Clinical engineering:A handbook for clinical and biomedical engineers[M].[S.l.]:Academic Press,2014. [2] Santens P,Boon P,Van Roost D,et al.The pathophysiology of motors symptoms in Parkinson’s disease[J].Acta Neuro- logica Belgica,2003,103(3):129-134. [3] Morris T R,Cho C,Dilda V,et al.Clinical assessment of freezing of gait in Parkinson’s disease from computer- generated animation[J].Gait & Posture,2013,38(2):326-329. [4] 顾磊,吴慧中,肖亮 . 一种基于人体轮廓宽度特征的步态识 别方法[J]. 计算机工程与应用,2007,43(24):4-6. [5] Sosnoff J J ,Klaren R E ,Pilutti L A,et al.Reliability of gait in multiple sclerosis over 6 months[J].Gait & Posture, 2015,41(3):860-862. [6] Bae J,Kong K,Byl N,et al.A mobile gait monitoring system for gait analysis[C]//IEEE International Conference on Rehabilitation Robotics,2009:73-79. [7] Begg R,Kamruzzaman J.A machine learning approach for automated recognition of movement patterns using basic,kinetic and kinematic gait data[J].Journal of Biome- chanics,2005,38(3):401-408. [8] Klucken J,Barth J,Kugler P,et al.Unbiased and mobile in Parkinson’s gait analysis detects motor impairment disease[J].PloS One,2013,8(2):e56956. [9] Chang C C,Lin C J.LIBSVM:A library for support vector machines[J].ACM Transactions on Intelligent Sys- tems & Technology,2011,2(3). [10] Vapnik V.The nature of statistical learning theory[M].[S.l.]: Springer Science & Business Media,2013. [11] 张学工 . 关于统计学习理论与向量机[J]. 自动化学报, 2000,26(1):32-42. [12] 郑恩辉,李平,宋执环 . 代价敏感支持向量机[J]. 控制与决 策,2006,21(4):473-476. [13] Cao P,Zhao D,Zaiane O.An optimized cost-sensitive SVM for imbalanced data learning[M]//Advances in Knowledge Discovery and Data Mining.Berlin Heidelberg: Springer,2013:280-292. [14] M’hamed Abidine B,Fergani B,Oussalah M,et al.A new classification strategy for human activity recognition using cost sensitive support vector machines for imbal- anced data[J].Kybernetes,2014,43(8):1150-1164. [15] Wang A G,An N,Chen G,et al.Predicting hypertension without measurement:A non-invasive,questionnaire-based approach[J].Expert Systems with Applications,2015,42 (21):7601-7609. (上接 125 页) [6] Zhou L G,Chen H Y.A generalization of the power aggregation operators for linguistic environment and its application in group decision making[J].Knowledge- Based Systems,2012,26(2):216-224. [7] Herrera F,Martinez L.A 2- Tuple fuzzy linguistic repre- for computing with words[J].IEEE sentation model Transactions on Fuzzy Systems,2000,8(6):746-752. [8] 姜艳萍,樊治平 . 二元语义信息集成算子的性质分析[J]. 控 制与决策,2003,18(6):754-757. [9] 姜艳萍,樊治平 . 基于不同粒度语言判断矩阵的群决策方 法[J]. 系统工程学报,2006,21(3):249-253. [10] Xu Y J,Wang H M.Approaches based on 2-tuple lin- guistic power aggregation operators for multiple attribute group decision making under linguistic environment[J]. Applied Soft Computing,2011,11(5):3988-3997. [11] Wang J Q,Wang D D,Zhang H Y,et al.Multi-criteria group decision making method based on interval 2-tuple linguistic information and Choquet integral aggregation operators[J].Soft Computing,2015,19(2):389-405. [12] Merigo J M,Gil-Lafuente A M.Induced 2-tuple linguistic generalized aggregation operators and their application in decision-making[J].Information Sciences,2013,236(1):1-16. [13] 刘金培,林盛,陈华友 . 二元语义 Bonferroni 集成算子及 其在多属性群决策中的应用[J]. 运筹与管理,2013,22 (5):122-127. [14] Zadeh L A.The concept of a linguistic variable and its application to approximate reasoning Part I[J].Infor- mation Sciences,1975,8(2):99-249. [15] Zhang H M.The multiattribute group decision making method based on aggregation operators with interval- valued 2- tuple information[J].Mathematical and Computer Modelling,2012,56(1):27-35. linguistic [16] 林建,兰继斌,林耀海 . 基于区间二元语义集结算子的多 属性群决策方法[J]. 吉林师范大学学报,2009,30(1):5-9. [17] Yager R R.On generalized Bonferroni mean operators for multi- criteria aggregation[J].International Journal of Approximate Reasoning,2009,50(8):1279-1286. [18] Yager R R.On ordered weighted averaging aggregation operators in multicriteria decision making[J].IEEE Trans- actions on Systems,Man,and Cybernetics,1988,18(1): 183-190. 计算机工程与应用www.ceaj.org
分享到:
收藏