logo资料库

智能医疗大数据论文翻译.docx

第1页 / 共8页
第2页 / 共8页
第3页 / 共8页
第4页 / 共8页
第5页 / 共8页
第6页 / 共8页
第7页 / 共8页
第8页 / 共8页
资料共8页,全文预览结束
3.1 数据检索和聚合模块
DataCare:面向智能医疗管理 的大数据分析解决方案 互动多媒体和人工智能国际期刊中的文章·2017 年 学生姓名: 王明晓 所属院系: 信息学院 专 学 业: 软件工程专硕 号: 21170231341 完成日期: 2017 年 12 月 27 日
目录 作者介绍............................................................................................................................................. 3 摘要..................................................................................................................................................... 3 1.介绍................................................................................................................................................. 3 2.最先进的技术................................................................................................................................. 4 3.架构概述......................................................................................................................................... 4 3.1 数据检索和聚合模块.........................................................................................................5 1)Buslogic.......................................................................................................................5 2)AdvantControl.............................................................................................................5 3)EasyConf.......................................................................................................................5 4)通信/集成 API..............................................................................................................5 3.2 数据处理和分析模块.........................................................................................................6 1)预处理引擎...................................................................................................................6 2)处理引擎.......................................................................................................................6 3)数据仓库.......................................................................................................................6 4)分析引擎.......................................................................................................................6 3.3 数据可视化模块.................................................................................................................6 4.评估................................................................................................................................................. 6 5.结论和未来工作.............................................................................................................................7 6.收获和感想..................................................................................................................................... 8 感 谢................................................................................................................................................... 8
作者介绍 Alejandro Baldominos 自 2012 年起担任马德里卡洛斯三世大学计算机科学家 和工程师,2013 年在这所学校获得硕士学位。目前在这所学校的计算机科学系 进化计算,神经网络和人工智能研究小组(EVANNAI)担任研究员,他正在攻 读西班牙教育,文化和体育部授予学位的博士论文。他还担任国际大学德拉里奥 哈大学可视化分析和大数据教授。他曾在人造智能,大数据和医疗保健领域发表 过多篇会议和期刊论文; 并参与了多个国家和欧洲的研究项目。 Fernando De Rada 是 Wildbit Studios 的首席执行官,马德里的卡米洛·何 塞·塞拉大学(UCJC)电子游戏制作副教授。他于 2003 年获得马德里自治大学 物理科学学位,并于 2014 年获得 UCJC 的形象,宣传和企业形象硕士学位。目 前他正在国家远程教育大学(UNED)攻读经济和商业科学学院的博士学位。自 从 20 世纪 80 年代后期以来,作为移动,游戏和数字媒体领域的企业家和高级管 理人员拥有超过 25 年的经验,他创建并管理着多领域的多学科团队,并取得了 可观的业绩。他一直在管理大数据,医疗保健,移动和视觉技术等多个国家的研 究项目。他还是西班牙互动艺术与科学学院的成员,并于 2014 年获得复古马德 里和 AUIC 的职业生涯奖。 Yago Saez 于 1999 年获得计算机工程学位。于 2005 年获得西班牙马德里理 工大学计算机科学(软件工程)博士学位。自 2007 年至 2015 年,他在马德里卡 洛斯三世大学获得任职,担任计算机科学系副主任,现任副教授。属于进化计算, 神经网络和人工智能研究组(EVANNAI),是 IEEE 计算金融与经济技术委员会 成员。 摘要 本文介绍 DataCare,智能医疗管理解决方案。该产品不仅能够从医疗中心的 不同关键绩效指标中检索和汇总数据,而且能够估算这些关键绩效指标的未来 值,从而在出现不良情况时提前发出警报或提供建议提高服务质量。DataCare 的核心流程建立在免费的开源跨平台面向文档的数据库(MongoDB)和 Apache Spark(开源的集群计算框架)之上。这种架构确保了高扩展性,能够处理来自 大量源的高速数据量。本文介绍了为该项目设计的架构以及在医疗中心进行试点 后的结果。关于不同情况下关键绩效指标如何变化以及如何影响患者满意度,已 经得出了有用的结论。 1.介绍 在管理医疗中心时,有许多可衡量的关键绩效指标(KPI),例如事件数量,等待时间, 计划巡回数等。通常,将这些 KPI 保持在预期范围内是获得用户高满意度的关键。 在本文中,我们将介绍 DataCare,一种用于智能医疗管理的解决方案。 DataCare 提供 了一个完整的体系结构,可以从安装在医疗中心的传感器中检索数据,进行处理和分析,最 终获得显示在用户友好的仪表板中的相关信息。
DataCare 的优点有两个:一是智能化。除了检索和汇总数据,系统能够根据过去的事件 预测未来的行为。这意味着系统可以提前发出警报(在未来的 KPI 预测具有超出预期边界 值时),并且为了改进行为和指标提供建议,或者是为了防止将来出现问题。 其次,核心系统模块建立在大数据平台之上。处理和分析在 Apache Spark 上运行,数 据存储在 MongoDB 中,从而实现高度可扩展的系统,能够以极高的速度处理大量的数据。 2.最先进的技术 医疗保健服务非常复杂且对生命至关重要,因此许多工作已经涉及医疗保健管理系统的 设计,旨在监测指标以检测不良行为(会导致降低其满意度甚至威胁其安全性的)。 医疗管理系统的设计和实施并不新鲜。在 2000 年,Curtright 等人描述了一个系统,他 在梅奥诊所有一个真实的应用程序,来监测在仪表板报告中总结的关键绩效指标。此外,格 里菲斯和金建议设置一位“冠军”,在医疗保健系统有一贯良好的指标,有助于改善决策过 程。 其中一些工作探索了提出建议的传感技术。如,Nai 等人关注 RFID 技术如何应用于医 疗保健管理系统,但只能在实际的环境中实施。Ting 等人也从制定,实施和维护的角度着 眼于 RFID 技术在这样一个项目中的应用。 之前的一些工作也解决了智能医疗管理系统的设计问题。 最近 Jalal 等人提出了一个智 能深度视频为基础的人类活动识别系统来跟踪老年患者,可以作为医疗保健管理和监测系统 的一部分。 但是,本文不探讨这种整合。 另外,Ghamdi 等人提出了一个基于本体的系统 来预测患者在 30 天内再入院情况,从而可以预防这些再入院情况。 关于数据在医疗管理系统中的影响,Bossen 等人已经解决了数据驱动方法的重要性。罗 伯茨等探索了如何使用设计思维框架来设计医疗保健管理系统。 Basole 等人提出了一个基 于网络的游戏,使用组织模拟进行医疗保健管理。曾等人提出了一个增强的 VIKOR 方法, 可以用作医疗管理环境中的决策支持工具。 Mohapatra 的相关工作探讨医院信息系统如何 用于医疗保健管理,提高 KPI; 在印度 Kalinga 医院进行了试点,对所有利益相关者都是有 利的。 一些工作也探索如何提高患者的满意度。例如,Fortenberry 和 McGoldrick 建议通过国 内市场的努力改善患者体验; 而 Minniti 等提出一种实时处理患者反馈信息的模型,并推动 周期性的快速改善。 为了将这项工作纳入其背景,我们开发了一个数据驱动型智能医疗管理系统。 由于数 据量大,速度快,我们采用了 Baldominos 等人提出的大数据架构,为了提高效率,使用 Apache Spark 更新了工具。此外,还指导一个试验来评估拟议系统的性能。 3.架构概述 DataCare 的架构包括三个主要模块:第一个监督检索和汇总在医疗中心或医院生成的信 息,第二个处理和分析数据,第三个在仪表板中显示有价值的信息,允许与外部信息系统结 合。
图 1-1 描述了这个体系结构的概况,而本节更详细地描述了每个模块 3.1 数据检索和聚合模块 数据检索由 Itas Solutions S.L.开发的 AdvantCare 软件来执行。 AdvantCare 是一套旨在 管理患者与医务人员之间通信的硬件和软件工具。它包括三个主要系统:1)Buslogic 管理 和汇总非医生人员(护士和护理助理)执行的行动信息,2)AdvantControl 监视和控制基础 设施,以及 3)EasyConf 管理语音通信。 在医院病房中,放置了不同的数据采集系统,这些系统通常由连接到 IP 网络的硬件设 备组成,并且包括以下元素之一: •传感器以连续或定期方式测量当前值或状态,并将其发送到 Buslogic 或 AdvantControl 服务器; 如温度计或噪音或光线传感器。 •辅助装置,如由患者操作的按钮或拉式处理器,并将辅助呼叫传送给 Buslogic 服务器。 •通过 EasyConf 处理来自其他设备或 Jitsi 即时通信软件(SIP Communicator)发送和接 收信息的语音和视频通信系统。 •数据采集系统通过设备(如平板电脑)中的图形用户界面进行操作; 例如调查或其他 信息系统。 一般而言,AdvantCare 检索的信息属于以下之一: •巡回计划:医疗人员将定期访问某些房间或患者作为预先制定计划的一部分。关于如 何转变数据对于评估护士和护理助理的援助质量和效率至关重要。 •援助任务:护士和护理助理在回应援助电话时必须正确执行。所以事先知道这些任务, 他们才能更好的驾驭。 •患者满意度:最重要的服务质量主观指标是患者的满意度,通过调查获得。 如前所述,AdvantCare 软件包括三个系统,以及通信/集成接口。 1)Buslogic 这个软件监督与援助呼叫系统的沟通。还处理 GestCare 和 MediaCare,他们是任务计划, 人员工作时间表,病人信息,满意度调查和娱乐的系统。 Buslogic 将检索有关援助过程的 核心业务信息:警报,等待时间以帮助患者,并实现援助目标。 2)AdvantControl 该软件控制和监视基础设施和自动化功能,包括灯,门或 DataCare 基础设施本身的状 态。 它将提供关于可能的服务质量问题的实时警报。
3)EasyConf 该软件管理 SIP Communicator,并提供相关呼叫的数据,如来源,目的地和总通话时间。 4)通信/集成 API 可以通过 SOAP Web 服务(SOAP 最早是针对 RPC 的一种解决方案,简单对象访问协 议,很轻量,同时作为应用协议可以基于多种传输协议来传递消息(Http,SMTP 等)。但是 随着 SOAP 作为 WebService 的广泛应用,不断地增加附加的内容,使得现在开发人员觉得 SOAP 很重,使用门槛很高)从 AdvantCare 服务器中检索数据,这些服务将用于需要高处 理能力且无状态的请求。 另外,可以通过 REST API 访问信息,其中通过 HTTP 请求执行 调用,并且以 JSON 序列化格式交换数据。 REST 服务器放置在软件服务器本身(Buslogic, AdvantControl 或 EasyConf)中,从而实现实时查询; 以及参数修改。 最后,TELNET 通道将 允许异步通信从服务器向连接的客户端广播事件。 3.2 数据处理和分析模块 数据处理和分析模块是基于 Apache Spark [14]大数据平台的一部分,它允许集成环境开 发和利用实时海量数据分析,比其他解决方案(如 Hadoop MapReduce 或 Storm)更胜一筹, 扩展到 10,000 个节点,提供容错能力[15],并允许使用类 SQL 的语言进行查询。如图 1 所示, 该模块由四个不同的系统组成:预处理引擎,处理引擎,大数据和历史数据仓库以及分析引 擎。 1)预处理引擎 该系统为 AdvantCare 数据执行 ETL(提取 - 转换 - 加载)过程。它首先使用可用的 API 与 AdvantCare 进行通信以检索数据,这些数据稍后将转换成适合引入处理引擎的格式。 由于 AdvantCare 提供的元数据,可以对信息进行分类以简化分析。规范化和整合的数据将 被存储在 MongoDB,这是领先的免费和开源的面向文档的数据库,其中集合将存储用于实 时分析的数据以及历史数据以支持批处理分析以计算不同指标在时间上的演变。 2)处理引擎 该系统运行在 Spark 计算集群上,并监督数据合并过程以定期汇总数据,并支持警报和 建议子系统。 3)数据仓库 由预处理引擎过滤并由处理引擎丰富的数据将被存储在大数据仓库中,它将存储实时信 息。另外,历史数据仓库存储汇总的历史数据,分析引擎将使用这些历史数据用来识别不同 质量指标的新趋势或趋势变化。 4)分析引擎 该系统运行将应用统计分析方法的批处理流程以及实时大数据的机器学习算法。随着历 史数据,时间序列和 ARIMA(自回归积分移动平均)技术提供了诊断模型的时间行为。 该 引擎还实现了基于贝叶斯的早期预警系统(EAS),该系统能够检测并预测预设阈值下的服 务质量或效率度量的下降,这将通过推送或电子邮件通知来通知。 3.3 数据可视化模块 该模块提供报告仪表板,可以实时接收来自大数据平台的信息,并显示在两个面板上。 第一个面板将实时显示主要的质量和效率指标,以及其随着时间的推移和质量门槛的变化。 第二个面板将提供分析引擎计算的诊断信息,以及智能建议以防止达到不希望出现的情况, 如指标低于可接受的阈值。 仪表板是使用 D3.js 库实现的,提供了非常直观的可视化。
4.评估 该系统已经在阿拉瓦卡(西班牙马德里)的住宅中心进行了评估,共收集了 7,473 个案 例。已经被定为必要的关键绩效指标中包括:每小时事件的数量(平均 15.37),平均等待 时间(351.15 秒),医疗人员平均所需的时间(35.47 秒),其他流程所需的平均时间(315.68 秒),每日远程取消人数(平均 46.36 人)和可用护士平均人数(6.79 人)。 在试验中,我们观察到夜间的平均等待时间比其他班次小得多(184.54 秒),大部分事 件发生在晚班(16.14 对早上 7.76 和晚上 8.19 )。另外,我们得出这样的结论:事件数量 和等待时间之间存在正相关关系。 另外,关于楼层数字,我们已经看到,较低的楼层有更多的事件,等待时间更长;趋势 表明,随着楼层数量的增加(从 1 到 4),活动减少。 从下午 8 点到凌晨 1 点的时间是最繁忙的,表明需要更多的人员参加中心的需求。 另外,我们已经把满意度调查作为额外的验证机制。为了确保质量指标与调查结果相匹 配,我们计算了满意度与事件数量和等待时间之间的 R^2 相关性(参见表 I)。 正如我们 所预期的那样,在几乎所有情况下,都存在强烈的负相关性,表明更多的活动等待时间越长, 患者满意度越低。 5.结论和未来工作 在本文中,我们介绍了 DataCare,一个智能和可扩展的医疗保健管理系统。 DataCare 能够通过安装在保健中心房间的传感器和环境信息从 AdvantCare 检索数据。 数据处理和分析模块能够以可扩展的方式预处理,处理和分析数据。 系统进程通过 Apache Spark 实现,因此可以处理大数据,并且所有数据(包括历史数据,实时数据和统一 数据和聚合数据)都存储在 MongoDB 中。 分析引擎是上述模块的一部分,它实现了三重智能行为。首先,它提供了一个预测系统, 能够估计当天剩余时间的 KPI 值。该系统作为每日批处理过程运行,预测在上午 8 点和下 午 4 点更新两次,以提供更准确的结果。二,它可以提供实时警报和早期预警,当未来某个 KPI 的预测超出预期的边界时,后一个预警会被触发。第三,推荐系统能够提供每周推荐以 改进整体中心表现和指标,从而以积极的方式影响患者的满意度。建议基于警报和由专家设 计的由 52 条规则组成的预定义规则集。 为了使用户能够查看和了解 DataCare 提供的有价值的信息,Visual Analytics 模块提供 了六个不同的仪表板,其中显示了当前状态的摘要,实时 KPI 以及预测和预期阈值,历史 值,警报,建议和患者调查结果。 DataCare 已经在阿拉瓦卡(马德里,西班牙)住宅中心的一个真正的试点实施和测试。 为了验证软件,病人的满意度和 KPI 相关性进行了探索,获得了预期的结果。 该软件还会 得出一些关于 KPI 如何根据环境而变化的有趣结论,如班次或地板。 试点后,我们已经确定了一些改进,留待将来的工作。首先,即使所使用的传感器允许 使用 RFID 标签进行识别,系统也不会识别病人的医务人员。 通过识别人员,中心可以单 独追踪每个员工的工作效率。 此外,有关计划巡回的信息是非常有限的,因为它只观察访 问的房间和访问时间,但没有其他指标。 到目前为止,DataCare 对 AdvantCare API REST 进行轮询以检索数据,但在未来我们将 更新平台使通信异步。
为了评估预测系统,我们还建议开发一个自我监测系统,用于评估预测系列和实际系列 之间的偏差,若偏差高于阈值,则发出警报,因为这意味着预测系统不能准确预测 KPI。 6.收获和感想 Datacare 医疗大数据智能和可扩展的医疗保健管理系统是智慧医疗信息体系的核心和 枢纽,与传统的区域卫生信息平台所不同之处在于,区域卫生信息平台以数据采集和管理类 应用为主,而医疗大数据智能管理平台的重点在于通过信息化的手段获取完整、准确、即时 的基础数据,构建人口信息、健康档案、电子病历和卫生资源等,通过智能分析的技术着力 为居民提供多模式、全方位的医疗卫生信息服务;为管理人员提供深度的数据挖掘和管理决 策支持;为医务工作者提供满足医联体和分级诊疗等模式的协同医疗服务等。 感 谢 对 WildBit Studios 开发和试用数据库特别感谢。该项目由西班牙工业,能源和 旅游部在“经济和数字社会战略行动”计划中提供了部分资金,参考号为 TSI-100105-2014-62
分享到:
收藏