logo资料库

论文研究-基于智能手机传感器的人体活动识别.pdf

第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
资料共6页,全文预览结束
188 2016,52(4) Computer Engineering and Applications 计算机工程与应用 基于智能手机传感器的人体活动识别 刘 斌 1,刘宏建 2,金笑天 1,国德峰 2 LIU Bin1, LIU Hongjian2, JIN Xiaotian1, GUO Defeng2 1.上海商业发展研究院,上海 200235 2.上海巨岩信息科技有限公司,上海 200032 1.Shanghai Institute of Commercial Development, Shanghai 200235, China 2.Giant Stones Information Technology Co., Ltd, Shanghai 200032, China LIU Bin, LIU Hongjian, JIN Xiaotian, et al. Human activity recognition based on sensors of smart phone. Computer Engineering and Applications, 2016, 52(4):188-193. Abstract:Activity recognition is a fundamental and challenging topic in context-aware applications. However, the current research on activity recognition cannot obtain satisfactory results by considering the complexity and diversity of human activity. To solve this problem, a novel method for activity recognition is proposed. The method extracts feature vector from three-dimensional acceleration sensor and gyro sensor of smart-phone, then construct recognition models based on four typical statistical methods(namely, K-nearest neighbor algorithm, support vector machines, naive bayes networks and AdaBoost)respectively, and finally select the optimal recognition model according to model evaluation and comparison. Experimental results show that the proposed method achieved good performance and the accuracy rate of activity recogni- tion is 92%. Key words:activity recognition; acceleration; gyroscope; statistical learning model 摘 要:人体活动识别是上下文感知系统及其应用中一个具有挑战性的研究问题。目前,关于人体活动识别的研究 主要使用一些基于监督学习或半监督学习的统计方法来构建识别模型。然而,考虑到识别活动类型本身具有的复 杂性和多样性,当前的人体活动识别系统不能取得较好的识别效果。针对这一问题,通过智能手机的三维加速度和 陀螺仪传感器信息来提取人体活动的特征向量,选择四种典型的统计学习方法(分别是 K-近邻算法、支持向量机、朴 素贝叶斯网络以及基于朴素贝叶斯网络的 AdaBoost 算法)分别创建人体活动的识别模型,最后通过模型决策得到最 优的人体活动识别模型。实验结果表明,通过模型决策选择的识别模型对人体活动识别准确率达到 92%,取得很好 的识别效果。 关键词:活动识别;加速度;陀螺仪;统计学习模型 文献标志码:A 中图分类号:TP393 doi:10.3778/j.issn.1002-8331.1402-0367 1 引言 人体活动包括一系列具有丰富含义的肢体运动,如 手指、手、手臂、头、面部或身体等姿态或运动模式,是一 种表达人的行为意图或者完成人与环境的信息传递方式。 人体活动识别是指计算机自动检测、分析和理解人体各 类运动和行为的过程,在人机交互、康复工程、教育、远 程会议、体育运动等方面具有广泛的应用前景。随着普 适计算的发展,尤其是部署在日常生活用品的微型传感 器的普及,使得人体活动识别获得了越来越多的关注。 此外,随着智能手机用户数量不断增长,基于智能手机 传感器的人体活动识别系统成为当前研究热点[1]。移动 设备通过识别用户的活动类型来可以感知用户的情景 上下文,从而为用户提供合适的服务。 近年的研究工作主要是利用可穿戴的传感器设备收 作者简介:刘斌(1972—),女,博士,副教授,研究领域:系统规划与管理;刘宏建(1977—),男,博士,研究领域:商业智能、数据 挖掘;金笑天(1973—),男,博士,研究领域:商业分析;国德峰(1983—),硕士,研究领域:信息管理、机器学习,E-mail: james.guo@giantstones.com。 收稿日期:2014-02-27 修回日期:2014-04-15 文章编号:1002-8331(2016)04-0188-06 CNKI 网络优先出版:2014-06-18, http://www.cnki.net/kcms/doi/10.3778/j.issn.1002-8331.1402-0367.html
刘 斌,刘宏建,金笑天,等:基于智能手机传感器的人体活动识别 2016,52(4) 189 集传感数据[2-4],然后基于多种统计学习方法来构建活动 识别系统。总体来讲,这些活动识别方法可分为两类: (1)基于监督学习算法的活动识别系统[5-9]。这类方法需 要一个人工标注的训练数据集来训练识别模型,但由于 多种因素(如标注数据采集费用,采集时间以及用户的 隐私等)使得这样的标注训练集很难获得。因此,基于 监督学习算法的活动识别系统在大规模的应用中遭遇 到严重的可扩展性问题。此外,大部分的活动识别系统 的学习方法都假设样本是独立同分布,然而考虑到用户 一段时间内不会频繁进行不同的活动,这种假设是不合 理的;(2)基于半监督学习算法的活动识别系统[10-14]。这 类活动识别系统不需要一个充分的训练数据集,所以具 有较好的扩展性。但是由于没有足够多的标记数据,使 得这类系统的识别性能通常没有基于监督学习算法的 识别系统好。到目前为止,人体活动的识别研究仅仅是 对于简单活动类型的识别(如跑、坐、上下楼等),而识别 复杂的活动类型仍然是一个具有挑战性的研究领域[15]。 针对上述方法的不足,本文提出一种通过智能手机 传感器信息识别人体活动类型的方法。智能手机的广 泛使用使得本文提出的方法很容易收集人体活动的数 据,因此本文提出的人体活动识别系统具有较好的可扩 展性。此外,为了评估所构建的人体活动识别模型的泛 化能力,本文选择四种基本的统计学习方法分别构建人 体活动识别模型,并通过实验进行模型决策来选择最优 识别模型。实验结果表明本文构建的识别模型具有较 好的识别准确性和泛化能力。 2 人体活动识别原理 人体活动包含一系列人的肢体动作,人的物理活动 由人体位置和活动模式决定,选择的传感器必须能反应 这两方面的信息,本文获取活动信息的方式采用智能手 机本身嵌入的三维加速度传感器和陀螺仪,这两类传感 器能提供测试对象的运动方向和运动幅度信息,可用来 采集人体活动信息。在这种运动信息获取方式中,可以 将智能手机穿戴在测试对象身上,人体活动信息可以通 过加速度或陀螺仪等传感器采集,经过特征提取和活动 建模后,运用统计和机器学习进行物理活动识别。其 中,将大量的低层传感器数据转换为高层的物理活动特 征是物理活动识别的关键问题。此外,活动环境的多样 性及物理活动的复杂性影响人体活动信息的准确获取, 为有效提取人体活动的信息,通过对人体活动信息的检 测与分析,需要进行去噪等数据预处理,保证人体活动 信息获取的准确度。 3 人体活动识别系统 人体活动识别研究包含人的活动数据采集、特征参 数提取和活动识别建模三个主要步骤。其中,提取活动 的特征向量是进行活动分析与识别的关键。 本文所提出的人体活动识别系统构架如图 1 所示, 首先通常智能手机收集三维加速度和陀螺仪的传感器 数据,然后提取传感器信号的时域特征和频域特征,对 特征向量进行去噪处理。对于预处理后的训练样本,采 用 主 成 分 分 析 方 法 对 原 始 的 特 征 向 量 提 取 主 成 分 信 息。最后,采用四种统计学习方法分别构建人体活动识 别模型:K-近邻算法、支持向量机、朴素贝叶斯网络和基 于朴素贝叶斯网络的 AdaBoost 算法。 输入 特征提取 数据预处理 主成分分析 支持向 量机 朴素贝叶 斯网络 K-最近 邻算法 AdaBoost 算法 模型选择 输出 图 1 系统构架图 3.1 特征提取 特征选取是进行人体活动识别的前提和关键。人 体活动的识别特征通常包括时域特征、频域特征和其他 域的特征。其中,时域特征包括计算信息的特性,如统 计最大值、均值、方差、平均交叉率、短时能量等;频域特 征包括 FFT 系数、频域熵等利用傅里叶变换或小波提取 的特征。从人体物理活动的加速度传感器信号中提取 的主要特征有活动窗口长度、均值、方差、标准差等统计 指标。对于每个活动样本数据,本文最终选择的特征向 量一共具有 512 维。 3.2 数据预处理 人的活动通常变化较慢,主要为低频信号,要求加 速度传感器具有较高的灵敏度。加速度传感器不仅对 地球本身的重力加速度敏感,也对各种因素带来的加速 度如环境噪声、高频干扰等敏感,而且人呼吸引起的身 体起伏也会对采集的加速度信号和陀螺仪信息造成影 响。这些噪声信息的频带宽、信号强,与人体活动加速 度信息混杂在一起。 为了提高活动识别模型的鲁棒性和精确性,需要从 提取出来的特征中过滤掉噪音和突变信号。小波分析 具有很好的消噪功能,它能同时在时频域中对信号进行 分析,并且在频率域内分辨率高时,使得时间域内分辨 率较低;在频率域内分辨率低时,时间域内分辨率较高, 即具有自动变焦的功能。所以,小波变换能有效地区分 信号中的突变部分和噪声,从而实现信号的去噪,本文
190 2016,52(4) Computer Engineering and Applications 计算机工程与应用 利用 Matlab 自带的一种小波消噪的阀值选取规则来选 取阀值,对信号分解的各尺度下的小波系数进行处理, 从而实现信号消噪处理。 3.3 主成分分析 主成分分析(PCA)是多元统计分析中用来分析数 据的一种方法,它是用一种较少数量的特征对样本进行 描述以达到降低特征空间维数的方法,它的本质实际上 是 K-L 变换。PCA 常用于减少数据集的维数,同时保持 数据集中对方差贡献最大的特征。 实验中将每个活动训练样本的 512 维特征向量降 到贡献率大于 98%的 k(k < 512) 维空间。本文的 PCA 算 法通过调用 Matlab 的 Princomp 函数实现。 3.4 人体活动识别算法 理论上来讲,所有的监督学习或半监督学习算法都 能用于人体活动的识别。为了进行实验对比,本文选择 以下四种具有代表性的统计学习方法来分别构建人体 活动识别模型:K-近邻算法、支持向量机、朴素贝叶斯网 络以及 AdaBoost 算法。 3.4.1 K-近邻算法 K-近邻算法(简称为 KNN)是一种基于实例的学习 算法,它不同于贝叶斯、决策树等算法,K-近邻算法不需 要训练,当有新的实例出现时,直接在训练数据集中找 K 个最近的实例,把这个新的实例分配给这 K 个训练 实例中实例数最多类。K-近邻算法分类器的优点是原 理简单,实现起来比较方便。支持增量学习,所以也叫 懒惰学习,不需要训练过程,在类标边界比较整齐的情 况下分类的准确率很高。此外,K-近邻算法需要人为决 定 K 的取值,K 值不同,模型识别的结果也会不同。 3.4.2 支持向量机 支持向量机将向量映射到一个高维的空间里,在这 个空间里建立有一个最大间隔超平面。在分开数据的 超平面的两边建有两个互相平行的超平面。分隔超平 面使两个平行超平面的距离最大化,分类器的总误差越 小。作为一种分类方法,SVM 通过核函数将低维空间 上线性不可分的样本映射到高维空间上线性可分的样 本空间,通过核函数计算内积,得到一个线性分类器。 常用的核函数有多种,如线性核函数,多项式核函数,径 向基核函数,Sigmoid 核函数和复合核函数。 SVM 应用于多分类时,通过一对多或一对一等组 合成多个分类器,然后通过投票或 DAG SVM 进行分 类。本文采用 Matlab 的 libsvm 工具箱构建基于 SVM 的 分类模型,libsvm 用的是线性核函数,核函数的选取对 分类器的性能有一定影响。 3.4.3 朴素贝叶斯网络 朴素贝叶斯网络基于贝叶斯定理与特征条件独立 假设的分类方法。对于给定的训练数据集,首先基于特 征条件独立假设学习输入/输出的联合概率分布;然后 基于该模型,对于给定的输入,利用贝叶斯定理求出后 验概率最大的输出。朴素贝叶斯实现简单,学习和预测 的效率都很高,是一种常用的方法。 Naive Bayes 算法: y )(x 输入:训练集 T ={(x 1 1 x(n) i 其中 x i = (x(1) i j 个特征向量,a 2n; l = 12S jl y 2 2 )(x y N N )} 。 x(2) 是第 i 个样本的第 i 是第 j 个特征训练的第 l 个值,j = 1 )T ,x( j) i ; y c Î{c 1 c 2 i K j } 。 输出:样本的分类结果 步骤 1 计算训练集的先验概率分布和联合概率分布: (a)P(Y = c ) = k N å i = 1 I(y = c ) k i N k = 12K (b)P(X ( j) = a |Y = c ) = k jl N å i = 1 I(x( j) i = a Y = c jl k ) N å I(y = c ) k i i = 1 步骤 2 对于一个给定的样本 x i = (x(1) i x(2) i x(n) i )T , 计算: P(Y = c n )Õ j = 1 k P(X ( j) = x( j)|Y = c )k = 12K k 步骤 3 确定样本类别: y = f (x) = arg max c k k = 12K n Õ j = 1 P(X ( j) = x( j)|Y = c )P(Y = c ) k k 朴素贝叶斯算法如图 2 所示。朴素贝叶斯算法采 用训练数据集作为输入,然后通过极大似然法计算输入 数据的先验概率分布和联合概率分布。最后,选择后验 概率最大的模型构建分类模型。 3.4.4 AdaBoost 算法 AdaBoost 是一种迭代算法,其核心思想是针对同一 个训练集训练不同的分类器(弱分类器),然后把这些弱 分类器集合起来,构成一个更强的最终分类器(强分类 器)。其算法本身是通过改变数据分布来实现的,它根 据每次训练集之中每个样本的分类是否正确,以及上次 的总体分类的准确率,来确定每个样本的权值。将修改 过权值的新数据集送给下层分类器进行训练,最后将每 次训练得到的分类器最后融合起来,作为最后的决策分 类器。使用 AdaBoost 分类器可以排除一些不必要的训 练数据特征,并将关键数据放在关键的训练数据上面。 由于 AdaBoost 算法构建的模型是二类分类器,不 能适用于多种类型的分类问题。因此,本文使用多类 AdaBoost 算法构建识别模型,多类 AdaBoost 算法基于 one-vs-rest[16],其中弱分类器使用朴素贝叶斯网络。本 文所使用的多类 AdaBoost 算法: y 2 y )(x 输入:训练集 T={(x 1 1 N ={12K}Î Y Î X Í Rn ,y 其中,x )(x y )} N 2 i i
刘 斌,刘宏建,金笑天,等:基于智能手机传感器的人体活动识别 2016,52(4) 191 输入:最终分类器 G(x) 步骤 1 For k = 1 to K 1if y ì i í -1else î (a)设置标志 yk i = = k (b)对于训练集使用 AdaBoost 算法学习第 k 个分 类器 f k (x) : yk Z k = (x ) 1 1 步骤 2 输出 G(x) = k̂ = arg max )(x yk m m )(x yk 2 2 f k (x) k 4 实验结果 为了评估本文所提出的活动识别模型,通过实验评 估所提出的四种方法(朴素贝叶斯网络、K-近邻算法、支 持向量机和 AdaBoost 算法)。 4.1 数据收集 使用运行 Android 4.0.3 操作系统的 HTC 手机用作 数据平台集合。数据收集参加者为年纪在 20~30 岁之 间的三个学生。每名学生完成六项人体活动(散步,步 行下楼,步行上楼,坐,站立和躺下)。通过智能手机嵌 入的加速计和陀螺仪收集速度和陀螺仪传感器数据。 通过特征提取和数据预处理后,用于训练(Train_Set)、 校验(Validation_Set)和测试(Test_Set)活动识别模型的 样本如表 1 所示。 表 1 模型训练、校验及测试样本集 人体活动 Total Train_Set Validation_Set Test_Set 站立 2 205 1 073 566 566 静坐 2 025 991 517 517 平躺 2 245 1 135 555 555 散步 下楼 上楼 1 942 1 550 1 763 928 507 507 768 391 391 883 440 440 由表 1 可知,收集的人体活动样本一共有 11 730 个, 本实验将其分为三部分:训练样本(5 778),校验样本 (2 976)和测试样本(2 976)。其中,训练样本占 50%,校 验样本 25%,训练样本为 25%。每个样本包括 512 维的 特征向量,如均值、方差等统计指标和频域特征。通过 PCA 计算贡献率超过 98%获得主成分分量,降维后得到 的特征向量的维数为 37。 4.2 实验过程 为了评估每种方法的活动识别性能,本文进行了 10-fold 的交叉验证,每个活动的数据集划分为 10 个子 样本。理想情况下,活动识别系统应该能够在不需要一 个 用 户 活 动 样 本 训 练 的 情 况 下 识 别 该 用 户 的 活 动 类 型。因此,为了避免使用同一个用户的活动数据进行训 练和测试,本文使得同一个用户的活动数据同时出现在 训练集和交叉验证的测试集中。 4.2.1 活动识别特征 为了评估本文提出的特征提取方法的有效性,基于 单独的 AdaBoost 算法构建活动识别模型将提出的活动 识别特征与另外两种常用的活动识别特征进行比较。 实验中使用训练集(Train_Set)的样本训练模型,然后使 用校验集(Validation_Set)样本数据进行性能评估。第 一种比较的活动识别特征 [17]由时间域特征和频谱域特 征两部分组成:时间域特征包括方差、均值、中值、相关 性 、25%百 分 位 分 数 、75%百 分 位 分 数 、平 均 合 成 加 速 度,频率域特征包括能量、熵、质心频率和峰值频率;第 二种比较的活动识别特征 [18]由基本特征和附加特征两 部分组成:基本特征是指均值、方差、相关性等统计特征 及能量、熵等频谱特征;附加特征是指三维加速度数据 一阶导数的统计特征,如均值、方差及相关性等;此外, 对于三类活动识别特征都使用主成分分析进行降维处 理,为了保证比较的客观性,确保三类特征降维后的维 数在大致相同的范围内,具体是本文提出的活动特征向 量为 37 维,第一类活动识别特征向量为 31 维,第二类活 动特征识别向量为 34 维。 从图 2 可以看出,基于三类特征使用单独 AdaBoost 算 法 构 建 活 动 识 别 模 型 的 平 均 准 确 率 分 别 是 82.1%, 87.4%和 91.5%。由此可见,本文提出的活动特征提取 方法的性能比另外两种特征提取方法更好。此外,从图 2 还可以看出,三类识别特征对站立和静坐这两种活动 的识别效果都比较差,这是因为基于加速度与陀螺仪信 息提取的识别特征不能有效区分相似的静态活动模式。 100 90 80 70 60 50 40 30 20 10 0 / % 率 确 准 站立 静坐 平躺 散步 下楼 上楼 First-Class Second-Class This-based 注:1)First-Class 为第一类活动识别特征 2)Second-Class 为第二类活动识别特征 3)This-based 为本文所提出的活动识别特征 图 2 基于 AdaBoost 使用三类活动识别特征的识别准确率 4.2.2 模型选择 实验将其收集的活动数据样本为三部分:训练样本 (Train_Set),校验样本(Validation_Set)和测试样本(Test_Set)。 其 中 ,训 练 样 本 占 50% ,校 验 样 本 25% ,训 练 样 本 为 25%。使用训练样本对活动识别模型进行模型训练,通 过在校验集上的预测精确度来帮助调整模型参数,并保 存校验集上的预测精度达到最优的训练模型,再用此模 型对测试集进行活动识别。在训练过程中进行 10-fold 交 叉校验,调整训练参数找出在训练集上预测精度最大的 训练模型,最后用该模型对测试样本进行预测。需要注
192 2016,52(4) Computer Engineering and Applications 计算机工程与应用 意的是,由于同一个人的每种活动具有相似性,所以同一 个人的活动样本不能同时出现在训练数据或者测试数据 中。为了评价分类模型的性能,选择 recall 和 precision 两个参数进行评估。 本文采用的四种方法中的基于 K-最近邻算法和支 持向量机构建的活动识别模型性能受到模型参数的影 响,实验过程中通过检验集来选择这两种方法构建的最 优人体活动识别模型。 (1)K-近邻算法 基于 K-近邻算法的人体活动识别模型的预测性能 主要受叶子节点数目的影响,实验中选择不同的叶子节 点数目来选择最优活动识别模型。表 2 是 K-近邻算法 (KNN)选择不同叶子节点数目在检验集上的识别精度 和召回率。从中可以看出,K = 8 时活动识别模型的识 别精度和召回率最高都为 88.2%。 表 2 KNN 活动识别模型不同 K 值 在校验样本上的预测性 K 值 识别精度 召回率 1 51.7 53.4 2 65.9 66.7 4 81.3 81.2 6 87.5 87.6 8 88.2 88.2 10 85.9 85.9 12 81.9 82.4 14 76.8 77.0 % 16 62.1 62.1 (2)支持向量机 基于支持向量机的人体活动识别模型的预测性能 主要受成本(cost)和核参数(gamma)两个参数的影响, 实验中通过选择不同的 cost 和 gamma 值来选择最优活 动识别模型。表 3 是支持向量机活动识别模型选择不 同参数在检验集上的识别精度,表 4 是支持向量机活动 识别模型选择不同参数在检验集上的召回率。从表中 可以看出,cost = 2 ,gamma = 1 时活动识别模型的识别 精度和召回率最高为 88.3%。 表 3 SVM 识别模型不同参数下校验样本的识别精度 % gamma 0.125 0.25 0.5 1 2 4 0.125 67.1 73.4 78.7 83.8 75.3 86.2 0.25 76.8 77.2 74.8 81.0 79.6 76.2 Cost 0.5 80.1 81.9 84.3 86.9 83.6 87.2 1 79.4 86.7 85.1 83.8 86.3 83.7 2 76.7 80.8 86.2 88.3 83.8 87.8 4 74.5 75.2 81.8 87.3 86.9 84.8 表 4 SVM 识别模型不同参数下校验样本的召回率 % gamma 0.125 0.25 0.5 1 2 4 0.125 67.3 73.4 78.7 83.4 75.3 86.2 0.25 76.8 77.2 74.5 81.0 79.6 76.2 Cost 0.5 80.1 81.9 84.3 86.9 83.6 87.0 1 79.4 86.7 85.1 83.8 86.3 83.7 2 76.7 80.8 86.2 88.3 83.8 87.8 4 74.5 75.2 81.6 87.3 87.0 84.8 4.2.3 实验结果分析 图 3 和图 4 显示了本文所提出的四种方法(朴素贝 叶斯网络、K-近邻算法、支持向量机和 AdaBoost 算法) 的识别准确率和召回率,其中 K-近邻算法和支持向量机 是由 4.2.1 中选择的最优识别模型,AdaBoost 的弱分类 器使用朴素贝叶斯网络。从图 3 和图 4 中可以看出,对 于实验中的 6 类人体活动的识别,多类 AdaBoost 算法都 是四种方法中识别性能最好的。此外,对于人体活动 “平躺”四种方法都获得良好的性能,而其余 5 类人体活 动则识别准确率相对较差,本文将在后面的内容中讨论 原因。 100 90 80 70 60 50 40 30 20 10 0 100 90 80 70 60 50 40 30 20 10 0 / % 率 确 准 / % 率 回 召 站立 静坐 平躺 散步 下楼 上楼 SVM Adaboost 图 3 四种方法对于人体活动识别准确率比较 Naive Bayes KNN 站立 静坐 平躺 散步 下楼 上楼 SVM Adaboost 图 4 四种方法对于人体活动识别召回率的比较 Naive Bayes KNN 表 5 显示四种方法对于 6 种人体活动识别的平均精 确度和召回率,可以看出多类 AdaBoost 方法也优于其 余的三种方法。 表 5 四种方法活动识别的平均准确率与召回率 识别方法 准确率 召回率 KNN 88.2 88.2 SVM 88.3 88.3 Naive Bayes 87.5 87.6 % AdaBoost 92.0 93.0 多类 AdaBoost 方法识别人体活动的混淆矩阵如表 6 所示。从表 6 可以发现,人体活动“站立”和“静坐”之 间的分类被混淆。这意味着,通过使用智能手机内置传 感器对“站立”和“静坐”进行分类是很困难的。对于这 些活动,加速度和陀螺仪采集的传感数据是很相似的, 需要使用其他的特征进行区分。
刘 斌,刘宏建,金笑天,等:基于智能手机传感器的人体活动识别 2016,52(4) 193 表 6 基于多类 AdaBoost 算法的人体活动识别混淆矩阵 实际类别 站立 静坐 平躺 散步 下楼 上楼 识别类别 站立 静坐 平躺 散步 下楼 上楼 491 82 70 428 0 0 0 0 0 0 0 1 3 7 555 0 0 0 1 0 0 497 18 10 0 0 0 4 1 0 0 6 344 5 29 424 在日常生活中,人们在一段时间内的活动具有连续 性,而不是处于频繁变换的状态,所以在一段时间内的 活动样本之间具有转移关系,而不是相互独立的。而本 文所使用的四种方法构建的活动识别模型都假设样本 之间是独立的,所以对于一段时间内传感器数据提取的 特征向量相似的不同活动不能取得较好的效果。此外, 考虑到人们在相同地点或者相同时间段的活动往往具 有相似性,在构建人体活动识别模型时还可以考虑地 点、时间等周围环境的情景信息来进一步优化人体活动 识别模型的识别性能。 5 结论 本文通过智能手机内置的加速度传感器和陀螺仪信 息来提取人体活动的特征向量,所提出的特征识别向量 包括统计特征和频谱特征两部分,实验表明本文所构建 的活动识别特征具有更好的识别性能。然后基于四种统 计学习方法(K-近邻算法、支持向量机、朴素贝叶斯网络 和 AdaBoost 算法)分别构建人体活动的识别模型,并通 过模型决策选择最优的活动识别模型。通过实验结果分 析,基于 AdaBoost 构建的人体活动识别模型是四种方 法中最优的,分别达到 92%的准确率和 93%的召回率。 通过识别模型预测的混淆矩阵分析,可知由于人们在一 段时间内的活动具有连续性而不是相互独立的,采用马 尔科夫转移矩阵构建活动识别模型应该能取得更好的 识别效果。此外,考虑到人们在相同地点或者相同时间 段的活动往往具有相似性,在构建人体活动识别模型时 还可以考虑地点、时间和周围环境(如天气状况等)等情 景信息来进一步优化人体活动识别模型的识别性能。 参考文献: [1] Ouchi K,Doi M.Indoor-outdoor activity recognition by a smartphone[C]//Proceedings of the 2012 ACM Conference on Ubiquitous Computing,2012:600-601. [2] Kern N,Schiele B,Schmidt A.Multi-sensor activity context detection for wearable computing[C]//Ambient Intelligence. [S.l.]:Springer,2003:220-232. [3] Lester J,Choudhury T,Kern N,et al.A hybrid discrimi- native/generative approach for modeling human activities[C]// IJCAI,2005:766-772. [4] Maurer U,Rowe A,Smailagic A,et al.Location and activity recognition using eWatch:A wearable sensor platform[M]// Intelligence in Everyday Life.[S.l.]:Springer, Ambient 2006:86-102. [5] Qian H,Mao Y,Xiang W,et al.Recognition of human activities using SVM multi-class classifier[J].Pattern Rec- ognition Letters,2010,31:100-111. [6] Preece S J,Goulermas J Y,Kenney L P,et al.Activity identification using body-mounted sensors—a review of techniques[J].Physiological Measurement, classification 2009,30. [7] Khan A M,Lee Y K,Kim T S.Accelerometer signal-based human activity recognition using augmented autoregressive model coefficients and artificial neural nets[C]//Engineering in Medicine and Biology Society,30th Annual Interna- tional Conference of the IEEE,2008:5172-5175. [8] 陈雷,杨杰,沈红斌,等.基于加速度信号几何特征的动作 识别[J].上海交通大学学报,2008,42:219-222. [9] 王昌喜,杨先军,徐强,等.基于三维加速度传感器的上肢 动作识别系统[J].传感技术学报,2010,23:816-819. [10] Gu T,Chen S,Tao X,et al.An unsupervised approach to activity recognition and segmentation based on object-use fingerprints[J].Data & Knowledge Engineering,2010,69: 533-544. [11] Guan D,Yuan W,Lee Y K,et al.Activity recognition based on semi-supervised learning[C]//13th IEEE International Conference on Embedded and Real-Time Computing Sys- tems and Applications,2007:469-475. [12] Stikic M,Larlus D,Schiele B.Multi-graph based semi- supervised learning for activity recognition[C]//Interna- tional Symposium on Wearable Computers,2009:85-92. [13] Zhang T,Liu S,Xu C,et al.Boosted multi-class semi- supervised learning for human action recognition[J].Pattern recognition,2011,44:2334-2342. [14] 卢先领,王洪斌,王莹莹,等.一种基于加速度传感器的人 体跌倒识别方法[J].计算机应用研究,2013,30:1109-1111. [15] Kim E,Helal S,Cook D.Human activity recognition and pattern discovery[J].Pervasive Computing,IEEE,2010,9: 48-53. [16] Alpaydin E.Introduction to machine learning[M].[S.l.]: MIT Press,2004. [17] Rasekh A,Chen C A,Lu Y,et al.Human activity recogni- tion using smartphone[R].Texas A&M Univ,2011. [18] Krishnan N C.A computational framework for wearable accelerometer-based activity and gesture recognition[R]. Arizona State University,2011.
分享到:
收藏