logo资料库

数据流通关键技术白皮书2018.pdf

第1页 / 共63页
第2页 / 共63页
第3页 / 共63页
第4页 / 共63页
第5页 / 共63页
第6页 / 共63页
第7页 / 共63页
第8页 / 共63页
资料共63页,剩余部分请下载后查看
数 据 流 通 关 键 技 术 白 皮 书 (1.0版) 中国信息通信研究院云计算与大数据研究所 2018年4月
版权声明 本白皮书版权属于中国信息通信研究院云计算与大数 据研究所,并受法律保护。转载、摘编或利用其它方式使用 本白皮书文字或者观点的,应注明“来源:中国信息通信研 究院云计算与大数据研究所”。违反上述声明者,本院将追究 其相关法律责任。 牵头编写单位:中国信息通信研究院 参与编写单位:上海数据交易中心有限公司、上海优刻得信息科技有限公司 (UCloud)、矩阵元技术(深圳)有限公司、蚂蚁金服(杭州)网络技术有限公 司、联通大数据有限公司、北京小米移动软件有限公司、中国联合网络通信有限 公司研究院、中兴通讯股份有限公司 编写组成员: 中国信息通信研究院:闫树、魏凯、姜春宇、刘成成、马鹏玮、王妙琼 上海数据交易中心有限公司:申翔宇、王润垠、叶梦沅 上海优刻得信息科技有限公司(UCloud):刘源、柯福顺、韩士璐、周雯婷 矩阵元技术(深圳)有限公司:谢翔 蚂蚁金服(杭州)网络技术有限公司:许志凯、李漓春、王力 联通大数据有限公司:刘险峰、田涛、范东媛 北京小米移动软件有限公司:孙善禄、郝昊天、汪烁雷 中国联合网络通信有限公司研究院:张云勇、魏进武、刘露 中兴通讯股份有限公司:罗圣美
前 言 当今社会,数据已经成为了比肩石油的基础性关键战略资源,正 在颠覆各个行业的发展模式。随着大数据产业市场规模的迅速扩大, 大数据的开放共享、交换流通成为趋势。可以说,数据流通是释放数 据价值的关键环节。然而,数据流通也伴随着权属、质量、合规性、 安全性等诸多问题,这些问题成为了制约数据流通的瓶颈。 为了解决这些问题,大数据从业者从诸多方面进行了探索。目前 来看,从技术角度的探索是卓有成效和富有潜力的。区块链、安全多 方计算等应用于数据流通的技术或技术框架为解决数据流通过程中 的问题提供了富有启发性的解决方案。随着这些技术的不断发展完善, 我们对数据流通产业的未来发展充满期待。 为了介绍数据流通的最新技术原理和应用场景,有效促进数据流 通产业发展,中国信通院云计算与大数据研究所组织编写了《数据流 通关键技术白皮书(1.0 版)》。本白皮书作为国内首个以“数据流通 技术”为主题的白皮书,深入分析数据流通的意义、价值和关键问题, 剖析数据流通技术需求与框架,详细阐述了数据流通技术工具及技术 方案,并对企业在数据流通实战过程中的精彩案例进行了介绍。希望 通过本白皮书吸纳业界最新观点,为关心数据流通行业的读者提供精 彩的技术资料。
目 录 前 言.............................................................. 3 一、数据流通的意义与关键问题........................................ 1 (一)数据流通基本概念 .......................................... 1 (二)数据流通的主要模式 ........................................ 2 (三)数据流通对社会发展的意义 .................................. 4 (四)数据流通面临的主要问题 .................................... 5 (五)数据流通技术需求 .......................................... 6 1. 个人信息保护 ............................................. 6 2. 安全保障 ................................................. 7 3. 追溯审计 ................................................. 8 4. 权益分配 ................................................. 8 二、数据流通主要技术框架........................................... 10 (一)数据流通技术实现概述 ..................................... 10 (二)安全多方计算技术 ......................................... 11 1. 安全多方计算技术框架描述 ................................ 11 2. 安全多方计算技术框架特性 ................................ 12 3. 安全多方计算技术框架优势................................. 16 (三)区块链技术 ............................................... 16 1. 区块链技术框架概述 ...................................... 16 2. 区块链技术框架特性 ...................................... 18 3. 区块链技术框架优势....................................... 21 (四)小结 ..................................................... 22 三、数据流通技术工具............................................... 24 (一)同态加密 ................................................. 24 1. 技术概述 ................................................ 24 2. 适用场景 ................................................ 25 3. 技术方案 ................................................ 26 4. 技术发展趋势 ............................................ 27 (二)零知识证明 ............................................... 27 1. 技术概述 ................................................ 27 2. 适用场景 ................................................ 29 3. 技术方案 ................................................ 29 4. 技术发展趋势 ............................................ 30 (三)群签名 ................................................... 31 1. 技术概述 ................................................ 31 2. 适用场景 ................................................ 31 3. 技术方案 ................................................ 32 4. 技术发展趋势 ............................................ 33 (四)环签名 ................................................... 33 1. 技术概述 ................................................ 33 2. 适用场景 ................................................ 33
3. 技术方案 ................................................ 34 4. 技术发展趋势 ............................................ 35 (五)差分隐私 ................................................. 36 1. 技术概述 ................................................ 36 2. 适用场景 ................................................ 36 3. 技术方案 ................................................ 37 4. 技术发展趋势 ............................................ 38 (六)数据标识技术 ............................................. 38 1. 技术概述................................................. 38 2. 使用场景................................................. 39 3. 技术方案................................................. 39 4. 技术发展趋势............................................. 40 (七)小结 ..................................................... 40 四、总结........................................................... 42 附录:数据流通企业实践案例......................................... 43 (一)中国联通打造大数据安全特区 ............................... 43 (二)中兴政务服务数据共享案例 ................................. 45 (三)小米全量受众匹配实现案例 ................................. 47 (四)矩阵元安全多方计算(MPC)数据协同 ........................ 49 (五)UCloud 出行数据共享案例 .................................. 50 (六) 上海数据交易中心 CAP 人群画像数据产品 .................... 53 (七) 上海数据交易中心 CRP 金融征信数据产品 .................... 55
图 目 录 图 1.1 点对点流通模式 ............................................ 2 图 1.2 星型结构流通模式.......................................... 3 图 1.3 网状结构流通模式 .......................................... 3 图 2.1 MPC 技术框架图 .......................................... 12 图 2.2 数据流通区块链平台....................................... 17 图 3.1 同态加密技术方案示意图................................... 26 图 3.2 零知识证明思想原理示意图................................. 28 图 3.3 零知识证明技术方案示意图................................. 30 图 3.4 基于群签名的身份认证模型 ................................. 32 图 3.5 基于环签名的身份认证方案................................. 34 图 3.6 数据输出差分隐私保护技术方案............................. 37 表 目 录 表 1 安全多方计算技术和区块链技术对比 ........................... 23 表 2 数据流通技术工具对比表 ..................................... 41
中国信息通信研究院 数据流通关键技术白皮书(1.0 版) 一、数据流通的意义与关键问题 当前,我国大数据产业继续保持强势增长态势,数据已经成为重 要的资源。发挥数据价值的关键在于数据流通。数据流通过程中存在 的问题,已经成为了目前制约大数据产业发展的“硬骨头”。可以说, 解决数据流通面临的问题迫在眉睫。 为了解决这些问题,从地方政府到业界专业都进行了诸多方向的 尝试和探索。例如,各地颁布了诸多促进数据流通的相关政策,推进 数据开放共享,并且取得了很大突破和进展。但随着大数据技术的不 断发展,人们逐渐发现,从技术角度的探索是值得关注和更具潜力的。 例如,区块链技术使得数据交互方可以不依靠第三方机构进行信任和 价值传递,安全多方计算技术使得数据拥有者在保护数据的前提下实 现数据价值发挥。随着这些技术工具的逐渐普及,我们有理由相信, 在接下来的几年中,数据流通的突破关键在于技术进步。 本章将对数据流通的基本概念和主要模式进行探讨,总结数据流 通面临的主要问题,研判数据流通的技术需求,从而为下文数据流通 具体技术的切入奠定基础。 (一)数据流通基本概念 近年来,信息系统、数据库、互联网技术的发展使人类社会活动 中的越来越多的内容被数字化记录。同时,云计算、大数据技术的发 展提升了对存量数据资源的加工效率,降低了处理成本。在此背景下, 存储于某个系统中完成业务目标的存量数据可能成为其他外部信息 1
中国信息通信研究院 数据流通关键技术白皮书(1.0 版) 系统所需的数据资源,并且数据资源的价值可以在流通后再次得到应 用,从而产生更多的应用价值。数据流通使数据脱离了原有使用场景, 变更了使用目的,从数据产生端转移至其他数据应用端,优化了资源 配置,成为释放数据价值的重要环节。此过程就是流通成为数据资源 价值传递的途径。 因此,数据流通可以被定义为某些信息系统中存储的数据作为流 通对象,按照一定规则的从供应方传递到需求方的过程。 (二)数据流通的主要模式 从技术架构方面来看,数据流通的主要模式可以分为:点对点流 通模式、星型结构流通模式以及网状结构流通模式三种模式。 点对点流通模式是数据的供需双方两个节点组成的数据流通系 统,数据供应方按照需求方的要求与约定规则,向需求方开放数据资 源库完成流通对象的转移。 图 1.1 点对点流通模式 星型结构流通模式是由一方作为数据资源收集者,收集与整理所 有其他数据资源拥有者的数据资源,并对所有数据资源进行再次加工, 最后提供给所有数据资源需求方的模式。这种流通模式多存在于数据 平台以中间代理人身份为数据提供方和数据购买方提供数据交易撮 2
分享到:
收藏