logo资料库

中科院2019年人工智能发展白皮书.pdf

第1页 / 共47页
第2页 / 共47页
第3页 / 共47页
第4页 / 共47页
第5页 / 共47页
第6页 / 共47页
第7页 / 共47页
第8页 / 共47页
资料共47页,剩余部分请下载后查看
2019年人工智能发展白皮书
目 录 01 风起云涌:人工智能关键技术不断取得突破 02 相得益彰:人工智能赋能产业与应用场景 03 04 百川归海:人工智能开放创新平台逐步建立 各领风骚:全球人工智能公司一览
前言 人工智能是一个很宽泛的概念,概括而言是对人的意识和思维过程的模拟,利用机器学习和数据分析方法赋予机 器类人的能力。人工智能将提升社会劳动生产率,特别是在有效降低劳动成本、优化产品和服务、创造新市场和 就业等方面为人类的生产和生活带来革命性的转变。据Sage预测,到2030年人工智能的出现将为全球GDP带来额 外14%的提升,相当于15.7万亿美元的增长。全球范围内越来越多的政府和企业组织逐渐认识到人工智能在经济 和战略上的重要性,并从国家战略和商业活动上涉足人工智能。全球人工智能市场将在未来几年经历现象级的增 长。据中国产业信息网和中国信息通信研究院数据,世界人工智能市场将在2020年达到6800亿元人民币,复合增 长率达26.2%,而中国人工智能市场也将在2020年达到710亿元人民币,复合增长率达44.5%。 我国发展人工智能具有多个方面的优势,比如开放的市场环境、海量的数据资源、强有力的战略引领和政策支 持、丰富的应用场景等,但仍存在基础研究和原创算法薄弱、高端元器件缺乏、没有具备国际影响力的人工智能 开放平台等短板。此份报告不但对人工智能关键技术(计算机视觉技术、自然语言处理技术、跨媒体分析推理技 术、智适应学习技术、群体智能技术、自主无人系统技术、智能芯片技术、脑机接口技术等)、人工智能典型应 用产业与场景(安防、金融、零售、交通、教育、医疗、制造、健康等)做出了梳理,而且同时强调人工智能开 放平台的重要性,并列举百度Apollo开放平台、阿里云城市大脑、腾讯觅影AI辅诊开放平台、科大讯飞智能语音 开放创新平台、商汤智能视觉开放创新平台、松鼠AI智适应教育开放平台、京东人工智能开放平台NeuHub、搜 狗人工智能开放平台等典型案例呈现给读者。最后,列举国内外优秀的人工智能公司与读者共勉。随着技术的进 步、应用场景的丰富、开放平台的涌现和人工智能公司的创新活动,我国整个人工智能行业的生态圈也会逐步完 善,从而为智慧社会的建设贡献巨大力量。
/01 风起云涌:人工智能关键技术不断取得突破
八大人工智能关键技术 选取标准: • 技术相对取得较大突破; • 应用场景相对明确; • 在产业界、学术界、投资界引起较大的关注。 计算机视觉技术 自然语言处理技术 跨媒体分析推理技术 智适应学习技术 群体智能技术 自主无人系统技术 智能芯片技术 脑机接口技术
1.计算机视觉技术 计算机视觉(Computer Vision)是一门研究如何使机器“看”的科学, 更进一步地说,是指用摄影机和电脑代替人眼对目标进行识别、跟踪和 测量的科学。近几年计算机视觉技术实现了快速发展,其主要学术原因 是2015年基于深度学习的计算机视觉算法在ImageNet数据库上的识别 准确率首次超过人类,同年Google也开源了自己的深度学习算法。计 算机视觉系统的主要功能有图像获取、预处理、特征提取、检测/分割 和高级处理。 图像获取 预处理 特征提取 检测/分割 高级处理 提取二维图 像、三维图 组、图像序 列或相关的 物理数据, 如声波、电 磁波或核磁 共振的深 度、吸收度 或反射度 对图像做一 种或一些预 处理,使图 像满足后继 处理的要 求,如:二 次取样保证 图像坐标的 正确,平滑 去噪等 从图像中提 取各种复杂 度的特征, 如:线,边 缘提取和脊 侦测,边角 检测、斑点 检测等局部 化的特征点 检测 对图像进行 分割,提取 有价值的内 容,用于后 继处理, 如:筛选特 征点,分割 含有特定目 标的部分 验证得到的 数据是否匹 配前提要 求,估测特 定系数,对 目标进行分 类 近年来,计算机视觉在产业界和学术界不断取得突破。 国际计算机视觉大会 (ICCV 2019) 欧洲计算机视觉会议 (ECCV 2018) 国际计算机视觉与模式识 别会议(CVPR 2019) ImageNet大规模视觉识别 挑战赛(ILSVRC) 其他 国际计算机视觉大会(IEEE International Conference on Computer Vision,简称ICCV)是全球计算机视觉领域三大顶 级会议之一,2019年该大会共收到4328篇论文投稿,相比上 一届 ICCV 2017,数量翻了一倍不止。其中,中科院和清华大 学的投稿数量在所有机构中遥遥领先。 欧洲计算机视觉会议(Europeon Conference on Computer Vision,简称ECCV)是全球计算机视觉领域三大顶级会议之 一,2018年该大会共收到论文投稿2439篇,涵盖对抗性机器 学习,对人、物体和环境的超快三维感知、重建与理解,面部 追踪及其应用,行人重识别的表征学习,视觉定位等主题。 国际计算机视觉与模式识别会议(Computer Vision and Pattern Recognition,简称CVPR)是全球计算机视觉领域三 大顶级会议之一,2019年该大会共录取来自全球的论文1299 篇,其中腾讯公司的腾讯优图和腾讯AI Lab有超过58篇论文被 接收,相比过去两年成绩大幅提升。 ImageNet大规模视觉识别挑战赛(ILSVRC)从2010年开始举 办,一年一度,至2017年终结,有力推动了计算机视觉的发 展。截至2016年,ImageNet中含有超过1500万由人手工注释 的图片网址,标签超过2.2万个类别,图像识别错误率已经达到 2.9%,远远超越人类(5.1%)。 清 华 大 学 研 究 团 队 提 出 了 一 种 全 新 的 卷 积 神 经 网 络 架 构 DenseNet,显著地提升了模型在图片识别任务上的准确率; 北京大学和微软亚洲研究院研究团队提出了一种新的硬感知深 度级联嵌入方法来考虑硬水平的样本;……
1.计算机视觉技术 计算机视觉技术的典型应用案例 交通 安防 医疗 自动驾驶汽车需要计算机视觉。特斯拉 中国在使用人脸识别技术方面无疑处于领先地 由于90%的医疗数据都是基于图像的,因此医 (Tesla)、宝马(BMW)、沃尔沃(Volvo)和奥迪 位,这项技术被广泛应用于警察工作、支付识 学中的计算机视觉有很多用途。比如启用新的 (Audi)等汽车制造商Y已经通过摄像头、激光 别、机场安检,甚至在北京天坛公园分发厕 医疗诊断方法,分析X射线,乳房X光检查,监 雷达、雷达和超声波传感器从环境中获取图 纸、防止厕纸被盗,以及其他许多应用。 测患者等。 像,研发自动驾驶汽车来探测目标、车道标 志和交通信号,从而安全驾驶。 翻译 体育赛事 农业 制造业 传统翻译采用人工查词的方式,不但 计算机视觉还有助于比赛和策略分 半自动联合收割机可以利用人工智能 计算机视觉也可以帮助制造商更安 耗时长,而且错误率高。图像识别技 析、球员表现和评级,以及跟踪体育 和计算机视觉来分析粮食品质,并找 全、更智能、更有效地运行,比如预 术(OCR)的出现大大提升了翻译的效 节目中品牌赞助的可见性。 出农业机械穿过作物的最佳路径。另 测性维护设备故障,对包装和产品质 率和准确度,用户通过简单的拍照、 截图或划线就能得到准确的翻译结 果。 外也可用来识别杂草和作物,有效减 量进行监控,并通过计算机视觉减少 少除草剂的使用量。 不合格产品。
2.自然语言处理技术 自然语言处理(Natural Language Processing)是一门通过建立形式化的 计算模型来分析、理解和处理自然语言的学科,也是一门横跨语言学、计算 机科学、数学等领域的交叉学科。自然语言处理,是指用计算机对自然语言 的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、 分析、理解、生成等的操作和加工。自然语言处理的具体表现形式包括机器 翻译、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识别等。 可以说,自然语言处理就是要计算机理解自然语言,自然语言处理机制涉及 两个流程,包括自然语言理解和自然语言生成,自然语言理解是让计算机把 输入的语言变成有意思的符号和关系,然后根据目的再处理;自然语言生成 则是把计算机数据转化为自然语言。实现人机间的信息交流,是人工智能 界、计算机科学和语言学界所共同关注的重要问题。 自然语言处理技术的技术层次 语音分析 词法分析 句法分析 语义分析 语用分析 从2008年到现在,在图像识别和语音识别领域的成果激励下,人们也逐渐 开始引入深度学习来做自然语言处理研究,由最初的词向量到2013年 word2vec,将深度学习与自然语言处理的结合推向了高潮,并在机器翻 译、问答系统、阅读理解等领域取得了一定成功。深度学习是一个多层的 神经网络,从输入层开始经过逐层非线性的变化得到输出。从输入到输出 做端到端的训练。把输入到输出对的数据准备好,设计并训练一个神经网 络,即可执行预想的任务。RNN已经是自然语言护理最常用的方法之一, GRU、LSTM 等模型相继引发了一轮又一轮的热潮。 自然语言处理技术的发展历程 未来 2008 • 深度学习 20世纪70年代 • 理性主义方法 • 基于统计的方法 20世纪50年代 • 图灵测试 • 经验主义方法 • 基于规则的方法
分享到:
收藏