Big Data
大数据时代
目录
1 2 3 4
1大数据概述
• 大数据产生的背景
• 什么是大数据
• 大数据时代
大数据产生背景
数据量级不断增加 | 根据IDC 监测,人类产生的数据
量正在呈指数级增长,大约每两年翻一番,这个速度在2020
年之前会继续保持下去。
数据结构日趋复杂 | 大量新数据源的出现则导致非结构化、
半结构化数据爆发式的增长
数据量级变化
TB
PB
EB
ZB
1GB(Gigabyte)=1024MB
1TB(Terabyte)=1024GB
1PB(Petabyte)=1024TB
1EB(Exabyte) =1024PB
1ZB(Zettabyte)=1024EB
地球上至今的数据量:
在2006 年,个人用户才刚刚迈进TB时代,全球一共
新产生了约180EB的数据;
在2011 年,这个数字达到了1.8ZB。
而有市场研究机构预测:到2020 年,整个世界的数
据总量将会增长44 倍,达到35.2ZB(1ZB=10 亿TB)
互联网(社交、搜索、电商)、移动互联网(微
博)、物联网(传感器,智慧地球)、车联网、
GPS、医学影像、安全监控、金融(银行、股市、
保险)、电信(通话、短信)都在疯狂产生着数据。
说
明
大数据时代
变化
在web 2.0的时代,
人们从信息的被动
接受者变成了主动
创造者
数据
全球每秒钟发送 2.9 百
万封电子邮件,
每天会有 2.88 万个小
时的视频上传到
Youtube,
推特上每天发布 5 千
万条消息
量级
每月网民在Facebook
上要花费7 千亿分钟,
发送和接收的数据高达
1.3EB
Google 上每天需要处
理24PB 的数据…
多样性大数据的定义
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,
是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样
化的信息资产。
想驾驭这庞大的数据,我们必须了解大数据的特征。
结
…
数
facebook 社交网络
电子商务
淘宝、ebuy
…
…
微博、Apps 移动互联
2大数据的4V特性
• 体量Volume
• 多样性Variety
• 价值密度Value
• 速度Velocity