logo资料库

论文研究-基于众包的地磁指纹采集系统的设计与实现 .pdf

第1页 / 共9页
第2页 / 共9页
第3页 / 共9页
第4页 / 共9页
第5页 / 共9页
第6页 / 共9页
第7页 / 共9页
第8页 / 共9页
资料共9页,剩余部分请下载后查看
中国科技论文在线 http://www.paper.edu.cn 基于众包的地磁指纹采集系统的设计与实 现 杜锋1,赵方1,罗海勇2** (1. 北京邮电大学软件学院,北京 100876; 2. 中国科学院计算机研究所,北京 100190) 摘要:室内定位技术用于当用户处在室内建筑时,实时获得用户的物理位置和基于位置的服 务。室内地磁信号由于特征明显并且信号稳定,用于做室内定位时表现出良好的精确性和鲁 棒性,成为了室内定位技术的一个选择。室内地磁定位技术分为离线指纹训练和在线定位两 个阶段。传统指纹训练一般由专业技术人员在室内采集大量地磁指纹数据,采集和维护开销 较大,阻碍了定位技术的应用推广。论文设计实现了一种基于众包的低开销室内地磁指纹采 集系统。该系统首先由众多普通用户分布式参与指纹采集,然后采用聚类算法,对不同用户 采集的地磁轨迹数据进行融合,从而构建出地磁指纹和地理空间之间的准确映射关系。实验 结果表明,使用基于众包的室内地磁指纹采集方法,可获得与传统专业地磁指纹采集相似的 定位精度。 关键词:地磁定位;众包;AP 算法;DTW 算法 中图分类号:TP393 5 10 15 20 The Design and Implementation of geomagnetic fingerprint acquisition system based on crowdsourcing method (1. College of Software Engineering, Being University of Posts and Telecommunications, Beijing DU Feng1, ZHAO Fang1, LUO Haiyong2 100876; 25 2. Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190) Abstract: The indoor localization technology is used to get the real-time physical position and to provide the location based service while user is in the indoor scenarioes. The geomagnetic indoor localization becomes a good alternative because of the differentiable and stable signal characteristics, which can obtain high localization accuracy and robustness.The geomagnetic localization consists of the offline training phase and online positioning phase. On the training phase, large number of geomagnetic data need to be collected for geomagnetic positionging fingerprint database construction and update, which exerts extensive cost for the traditional professional fingerprint collection method. To reduce acquisition costs, a geomagnetic fingerprint collect system based on the crowdsourcing method was proposed. This System help establisheding correspondence between geomagnetic fingerprints space and physical space after geomagnetic fingerprint collecting, fingerpring clustering and geomagetic fusioning. The experimental results show that we can get a similary accuracy of positioning using the crowd-soucing geomagenetic data which is compared with the traditional fingerprint collecting. Key words: geomagnetic localization; crowd-sourcing; AP;DTW 30 35 40 0 引言 随着大量的室内建筑的增加和人们在日内日常活动时间的大量增多, 获取用户室内位 置成为一项非常必要的研究内容。吸引了很多研究小组对这个内容投入了大量精力进行研 究。同时,人们也意识到了室内定位不仅仅是用于获取用户室内位置,同时也可以进行很多 作者简介:杜锋(1990-),男,硕士研究生,主要研究方向:移动计算与智能感知 通信联系人:赵方(1968-),女,教授,主要研究方向:移动计算、移动定位技术. E-mail: zfsse@bupt.edu.cn - 1 -
中国科技论文在线 http://www.paper.edu.cn 45 基于室内定位的服务,很多研究中心提出了室内定位的很多思路,比如,使用 RFID、Wi-Fi、 蓝牙等信号来作为定位的特征信号进行定位服务。近年来,拥有 WiFi、GPS[1]、加速度、磁、 陀螺仪等传感器的智能终端迅速普及,为室内定位技术提供了良好的平台和硬件条件。在这 样的硬件平台和技术支持下,也已经有了很多的基于射频指纹信号的室内定位服务。 然而,在目前市场上大部分的室内定位服务中,仍然存在着定位精度、普适性等很多问 50 题。在这个目标激励下,很多国内外的研究机构、公司、大学等都希望能提供一个稳定、定 位精度高、能满足用户需求的定位服务。 由于地磁信号的稳定性等特征,地磁室内定位系统变得越来越流行[2],由于地磁信号模值 的特征,现在一般使用室内航迹推断[3]同粒子滤波的框架结合的方式进行定位[4],在地磁定 位中,同样需要训练阶段和定位阶段来完成,目前已经有很多研究基于训练阶段的地磁指纹 采集[5]。 55 本文基于众包[6]的思路,设计和实现了基于地磁指纹库的采集系统,通过移动终端的传 感器采集室内的地磁指纹数据。然后将数据上传到服务器之后进行处理,众包服务器对数据 进行预处理,同时使用 DTW 算法和 AP 算法进行相似度计算和聚类。最终将这些地磁指纹 数据进行融合,构建地磁指纹数据库。本来对系统的总体模块和核心流程、算法进行了详细 60 的阐述。 1 基于众包室内地磁指纹采集系统 1.1 地磁定位系统架构 地磁定位系统的架构主要有两部分构成,即指纹训练阶段和定位阶段。系统的架构如图 1 所示 65 图 1 地磁定位系统架构 由图 1 可以看到,整个系统架构由训练阶段和定位阶段两部分构成,本文主要针对训练 阶段做出研究和设计实现。训练阶段需要采集地磁指纹,并且将地磁指纹进行一定的处理之 70 后,构建地磁指纹库。定位阶段需要将实时获取到的地磁指纹与地磁指纹库中进行比对,最 后得到实时位置。在训练阶段的指纹处理阶段,需要将采集的地磁指纹轨迹分割为无拐弯的 原子路径,然后计算地磁曲线的相似度、对原子路径进行聚类,校正由于惯导信息带来的偏 差。所以,在地磁指纹的采集过程中,最关键的步骤为地磁曲线相似度的计算和地磁聚类算 法。 - 2 -
中国科技论文在线 75 1.2 地磁曲线相似度计算 http://www.paper.edu.cn 由于众包采集是基于大量用户使用采集器采集地磁指纹数据的思路,所以我们需要将采 集上来的带有地磁值的路径按照拐弯划分为原子路径(原子路径即没有拐弯的路径)。然后 在物理上相同的原子路径需要将其聚类到同一类别下,这就需要计算任意两条原子路径的地 磁曲线相似度。本文采用在声音匹配、模式匹配已经行为识别上都广泛应用的 DTW[7] (Dynamic Time Wrapping)算法。DTW 算法通过每次找两个时序中,”距离”最近的两个点, 80 从而获取整个序列的相似度。如图 2 所示 图 2 DTW 匹配示意图 85 假设第一条磁场信息序列为 M,曲线上的地磁点依次为,另一条地磁信息序列为 N,曲 线上的地磁点依次是,其中和 大多情况不相等。本文需要求,从第一条地磁信息曲线,变化 到第二条地磁曲线所需要的代价,即是两条地磁曲线的相似度。为了描述这一算法,本文假 设已经获得了第一条曲线中前 i 个地磁采样点和第二条曲线中前 j 个地磁采样点的相似度。 那么下一个可以通过的地磁采样点即是(i + 1, j), (i, j + 1)和(i + 1, j + 1)中的一条,因此动态规 90 划方程如下图所示。 表示第一个曲线中 0 至 i 个点的子序列与第二条曲线中 0 至 j 个点的子序列的地磁轨迹 相似度。表示两点和的欧式距离(在这里采用地磁值相减的平方)。 假设第一条磁场信息序列为 M,曲线上的地磁点依次为,另一条地磁信息序列为 N,曲 95 线上的地磁点依次是,其中和 大多情况不相等。本文需要求,从第一条地磁信息曲线,变化 到第二条地磁曲线所需要的代价,即是两条地磁曲线的相似度。为了描述这一算法,本文假 设已经获得了第一条曲线中前 i 个地磁采样点和第二条曲线中前 j 个地磁采样点的相似度。 那么下一个可以通过的地磁采样点即是(i + 1, j), (i, j + 1)和(i + 1, j + 1)中的一条,因此动态规 划方程如下图所示。 100 105 表示第一个曲线中 0 至 i 个点的子序列与第二条曲线中 0 至 j 个点的子序列的地磁轨迹 相似度。表示两点和的欧式距离(在这里采用地磁值相减的平方)。 显然,该算法的时间复杂度是 o(m * n),因为本文需要推到出二维的状态 dp 中的所有可 能性。一种常见的解决方案是采用基于增量的 DTW 算法,当计算新的地磁点的数据时,仅 仅使用前一个的地磁点的数据,显然仅仅和当前 i 值或者 i – 1 值有关。这种方法将空间复杂 度从原来的 M * N 缩小到 M * 2,但是时间复杂度没有改变。为了减少时间复杂度,FastDTW[8] 和 SparseDTW[9]提供了两种比较好的解决方案,时间复杂度缩小到线性的,接近 o(n), 但由 于本课题中建立数据库指纹数据库大多在离线时完成的因此,对算法效率要求不高,因此, - 3 - ,1,,11,1,min(,,)((1,),(1,))ijijijijijdddddistinjm,1,,11,1,min(,,)((1,),(1,))ijijijijijdddddistinjm
中国科技论文在线 http://www.paper.edu.cn 本文将综合上述做法,最终将两条曲线的相似度归约话为(0, 1)之间的值(1 表示两条曲线完 110 全一致)。 1.3 地磁曲线聚类算法 在地磁指纹采集过程中,基于惯导的航迹推断存在误差。考虑到采用众包地磁轨迹采集 方法,在同一个地理轨迹上可能多个航迹信息,利用在相同地理轨迹上采集的地磁轨迹数据 具有一致性,对同一地理轨迹上采集地磁指纹形成的航迹数据进行识别和融合,可有效提高 115 航迹推断的准确性。本文采用空间聚类算法,在识别出用户拐弯行为的基础上,以两次拐弯 之间的直线路径为原子聚类单位(即原子路径),对所有原子路径进行聚类,获得与每个空 间地理路径对应的原子路径簇。对每个簇内原子路径进行航迹融合,得到对应空间地理路径 的一个估计。 120 为减少聚类计算开销和提高聚类准确性,本文首先根据地磁原子轨迹方向、长度进行层 次聚类,然后使用 AP[10](Affinity Propagation)聚类算法对层次聚类后的结果进行聚类。在统 计学和数据挖掘领域,AP 仿射聚类算法是通过待分类点“消息传递”完成分类的。AP 算法和 K-means[11]算法不同,AP 算法不需要确定或者事先估计分类的种类数,因此非常适合在不 知道具体室内地图情况下的众包采集模式。 AP 算法具体实现流程如下。 125 a) 利用 DTW 值构建相似度矩阵 首先,AP 聚类算法需要构建相似度矩阵,本系统利用 DTW 算法生成任意两条地磁曲 线的相似度,构造初始的相似度矩阵 S,S(i, j)表示第 i 条地磁曲线和第 j 条地磁曲线的相似 度。生成相似度矩阵后,本系统需要设置聚合度,不同的聚合度会产生不同的分类效果,本 文采用相似度矩阵的中位数作为系统的聚合度。 130 b) 设置吸引度 R(Responsibility)和归属度 A(availability) 在算法初始时,本系统设置所有的点均是可能的中心点(exemplar),然后数据不断的迭 代,直至满足条件的蔟类中心和类形成。吸引度 R(Responsibility)和归属度 A(availability)表 示地磁轨迹和候选集的关系。R(i, j)表示从地磁曲线 i 发送至可能的聚类中心 j 的消息传递值, 该值的大小反应聚类候选集 j 是否适合作为地磁曲线 i 的聚类中心。A(i, j)表示从聚类候选集 135 j 发送信息至地磁曲线 i,该值的大小反应地磁曲线 i 是否选择候选集 j 作为聚类中心。在初 始时,本系统设定: c) 更新吸引度 R(Responsibility)和归属度 A(availability) 设置完初始值后,AP 算法就开始迭代更新每一个节点的吸引度 R 和归属度 A 的值,直 140 到最终生成 m 个满足聚合度的聚类中心。迭代过程如下所示。 for all i, k 通过上式的计算,根据 R(k,k)和 A(k, k)的值判断聚类候选集 k 是否能够成为聚类中心。 145 d) 判断迭代是否完成 当迭代次数超过一定的次数后(本系统设置最大迭代次数为 1000 次),或者聚类中心不 - 4 -
中国科技论文在线 http://www.paper.edu.cn 再发生改变后,即完成了聚类。聚类候选集即是聚类中心。 2 系统设计与实现 2.1 系统模块设计 150 基于众包室内地磁指纹采集系统由两部分构成,位于智能终端的采集器和 Linux 服务器 上的众包数据处理服务器,具体架构如图 3 所示。 图 3 基于众包室内地磁指纹采集系统架构 155 如图 3 所示,采集器属于智能手机终端软件,主要有计步器、拐弯检测和地磁指纹数据 采集三个模块构成。采集软件使用了只能终端中的加速度传感器、陀螺仪和地磁传感器。其 中,计步器为核心触发模块,根据设置的采样频率,同陀螺仪传感器配合,记录当前步的地 磁模值序列和当前行走方向。拐弯检测用于记录采集过程中的拐弯路径。地磁指纹采集用以 在计步过程中按照设定的频率采样。 160 2.2 智能终端采集器算法 智能终端采集算法主要为代码如表 1 所示 表 1 地磁指纹采集算法 Algorithm 1 Geomagnetic fingerprint collecting algorithm 1: 2: 3: 4: 5: 6: 7: 8: 9: 10: 11: Begin env=setCurrentEnvironment() pos=readInitialPosition ... InitParticleFilter(); %put particles into the whole env Walking ; %process the procedure of particular filter ... When not click end button when not turn using readMagenetic() record the magenaetic data in this position using readDirection() record the current dirction endwhen using setTurnFlag() record the turn flag endwhen End 采集器以计步器作为触发模块,使用其他定位方式确定初始坐标之后,启动粒子滤波框 - 5 -
中国科技论文在线 http://www.paper.edu.cn 165 架,之后再行走采集的过程中更新粒子情况同时进行采集地磁指纹。每走一步进行拐弯检测, 检测到拐弯时进行置入拐弯标记。当检测到本次采集路径的工作已经完成时,讲采集的数据 结果上传到服务器,进行进一步处理。 2.3 众包采集服务器端流程 众包采集服务器端为本系统的核心流程,需要将客户端采集的数据接收到 Linux 服务器 170 端,然后进行坐标转换、原子路径分割、数据聚类处理、地磁曲线融合等一系列操作。服务 器端处理流程如图 4 所示。 图 4 众包采集器服务器端工作流程图 175 如图 4 所示为众包采集服务器端工作流程,服务器端软件运行于 Linux 服务器端。服务 器端运行两个独立线程,第一个打开 Socket 服务器端接口接受客户端采集并上传的地磁指 纹数据,并将其保存于文件系统当中。 第二个独立运行的线程为众包服务器核心处理线程。负责处理众包数据和构建地磁指纹 库的过程。服务器端启动定时器程序后,定时对众包数据进行处理。首先,从文件系统中获 180 得地磁指纹的元数据。其中每一条数据以文件的形式存在于文件系统。地磁元数据的数据格 式包含路径起始位置、步长、方向角、地磁值序列、拐弯标记、时间序列等多个信息。系统 根据距离、方向、和初始坐标可以计算出每一个地磁值的坐标位置,即完成了坐标转换。我 们将两个拐弯之间的路径称之为原子路径,代表一段直线并且不会拐弯的路径。通过元数据 中的拐弯标记可以将元路径分割为一个个含有坐标的原子路径。 185 由于智能终端的惯导信息存在偏差,我们需要对原子路径聚类以提升坐标和地磁指纹之 间对应关系的准确性。为了提升聚类的准确度,我们首先对原子路径按照方向和距离的不同 进行层次聚类。层次聚类可以很大程度上提高聚类结果的准确性。之后,在每一个聚类结果 中,使用 DTW 算法计算每两条原子路径的相似度。 使用 DTW 算法计算出层次聚类后每一类中任意两个曲线的相似度之后,使用该值作为 190 聚类标准。将聚类结果中每一个类使用 AP 算法进行聚类运算。在每一类中聚类出结果。再 使用 DTW 算法进行曲线融合,这样可以在大数据量的情况下,减少航迹推断带来的惯导信 息误差。将所有融合后的结果写入到地磁指纹库中,即完成了众包服务器处理地磁数据的议 论工作,成功构建了地磁指纹库。由于服务器端是定时重复执行地磁指纹库构建的,在数据 - 6 -
中国科技论文在线 http://www.paper.edu.cn 量越来越大的情况下。地磁指纹库的精确度也会越来越精确。 195 2.4 地磁数据聚类复杂度分析 核心算法流程中时间复杂度主要集中在 DTW 算法上,DTW 算法的时间复杂度为级别, 假设每条地磁曲线有 M 个采集地磁指纹数据,共有 N 条曲线。通过层次聚类不仅可以提升 聚类效果,同时也可以将算法的平均时间复杂度从*降低到。其中 K 为层次聚类的平均聚类 数目。 200 3 实验及分析 为了评估我们的地磁指纹收集系统,我们在中科院计算所(ICT)7 层建立了一个仿真 系统来进行实验,以下为实验环境和基本结果。 3.1 实验条件 我们选取的中科院计算所(ICT)7 层作为实验场景,实验场地的平面地图如图 5 所示 205 图 5 ICT 7 层室内平面图 图 7 所示的 ICT 7 层室内场景为 100m 长和 40m 宽,是典型的室内办公室场景。我们选 择室内路径作为众包地磁数据采集地磁指纹数据用于实验和仿真。在前期我们选用的测试设 210 备为三星 GalaxS4(I9500)智能手机,拥有 1.6GHz 的 CPU 和 2Gb 的 RAM,同时拥有重力感 应器,加速传感器,和三轴地磁传感器。三星 S4 手机拥有的智能传感器这些模块可以完整 的完成采集和仿真工作。 3.2 不同参数值 AP 聚类效果 我们在指纹采集系统处理阶段很重要的工作就是使用聚类算法将地理上位置、方向一致 215 的原子路径聚类到一起,来校正惯导信息的误差。我们在本系统中使用 AP 算法进行聚类, 影响 AP 算法的参数主要有 lamp 和 preference 两个参数。我们根据经验值来调整不同的参 数,以达到最好的实验结果,聚类的效果图使用 Matlab 仿真出来,如图 6 所示。 图 6 原子路径聚类仿真效果 - 7 -
中国科技论文在线 http://www.paper.edu.cn 220 如上图所示,点表示采集的轨迹,两点间的连线表示这两点属于同一类,类的中心为簇 心。AP 聚类算法根据地磁相似度矩阵,自动将轨迹数划分为 9 部分,AP 聚类算法的结果如 表 2 所示。 表 2 不同 lamp 参数和 preference 参数的 AP 聚类结果 原子路径总数 45 45 45 45 45 45 lamp 参数 0.6 0.7 0.8 0.6 0.7 0.8 preference 参数 聚类数目 均值 均值 均值 中值 中值 中值 7 7 7 5 5 5 正确率 91.11% 91.11% 91.11% 97.78% 97.78% 97.78% 225 有表 2 可以看出,lamp 参数和 preference 参数影响原子路径的聚类结果,其中当 preference 参数取中值的时候聚类效果明显较好,lamp 参数取值对聚类结果没有太大影响。 3.3 众包指纹定位性能 我们选取 ICT7 层作为仿真基地,在仿真之前,我们需要随机的在测试环境中选取一些 测试点。当测试人员有序的经过这些测试点的时候,记录下测试时获得的定位结果,将这些 230 结果同我们真实的物理位置对比,可以得出我们的指纹库定位效果。最后,可以通过 CDF 图来呈现我们的定位性能,实验采用的定位阶段思路是在计步器计步过程中采集地磁指纹值 同上一步地磁指纹的增量值匹配的算法,整个定位算法在粒子滤波的框架下完成。图 8 所示 为仿真环境。 235 图 7 地磁定位实验仿真环境 如图 7 所示,左边为仿真环境下选取的测试区域,右边的图片展示了测试时测试人员需 要测试的室内路径,右边图中的红色路线部分表示定位仿真实验时实验人员走过的试验路 径。定位的性能为图 8 的 CDF 图所示。 240 图 8 ICT 定位性能 CDF 图 - 8 -
分享到:
收藏