2018 中国人工智能指数
China AI Index 2018
陈络、崔晓晖、莫泉、肖蓉、许成钢、杨威
1
武汉大学大数据与云计算实验室
长江商学院人工智能-制度研究中心
2
作者(按姓氏字母排列)
陈络(研究生,武汉大学大数据与云计算实验室)
崔晓晖(主任、教授,武汉大学大数据与云计算实验室)
莫泉(研究生,武汉大学大数据与云计算实验室)
肖蓉(研究生,武汉大学大数据与云计算实验室)
许成钢(主任、教授,长江商学院人工智能-制度研究中心)
杨威(研究生,武汉大学大数据与云计算实验室)
3
2018 中国人工智能指数
目录
摘要 ..........................................................................................................................................................................3
前言 (Overview) ..............................................................................................................................5
1.
中美人工智能发展对比 (AI Development: China vs. US) ...........................................6
2.
2.1 学术领域 (Academia) ......................................................................................................................6
2.1.1 学术刊物论文发表数量 (Journal Publications) .................................................7
2.1.2 学术会议出席人次 (Conference Participation) .................................................8
2.1.3 学术影响力指数:论文引用指数 (Impacts of Publications: Citations)
.............................................................................................................................................................. 10
2.1.4 期刊论文的质量指标:分级引用指数 (Quality of Jurnal Pblications:
Citation Fequency) .................................................................................................................... 13
2.1.5 会议论文的质量指标:分级引用指数 (Quality of Conference Papers:
Citation Frequency) .................................................................................................................. 16
2.1.6 人工智能各领域分析 (Sub-areas of AI) .............................................................. 20
2.2 人才储备及分布 (AI Talents) ................................................................................................. 28
2.2.1 人工智能人才总体情况 (AI Talent Pool) ....................................................... 28
2.2.1 人工智能学术人才的分布 (AI Talents in Academia) ..................................... 30
2.3 产业领域 (AI Industry) ............................................................................................................ 38
2.4 开源人工智能软件包(Open Source AI Softwares) ......................................................... 38
2.5 公众认知及媒体报道 (Media Coverage on AI) ................................................................ 41
参考文献 (Reference) .................................................................................................................................. 43
附录 (Appendix).............................................................................................................................................. 44
A1: 学术论文 (A1: Journal Publications) ...................................................................................... 44
主要数据源和数据集 (Data Sources) ........................................................................................... 44
收集的数据的定义 (Definitions of Variables) .................................................................... 44
收集过程 (Data Collection) ........................................................................................................... 44
备注 (Remarks) ....................................................................................................................................... 45
A2: 会议出席情况 (Conference Participation) ............................................................................. 45
主要数据源和数据集 (Data Sources) ......................................................................................... 45
收集的数据的定义 (Definitions of Variables) .................................................................... 45
收集过程 (Data Collection) ......................................................................................................... 45
备注 (Remarks) ....................................................................................................................................... 46
A3: AI 领域创业公司 (Startup Companies in AI) .......................................................................... 46
主要数据源和数据集 (Data Sources) ........................................................................................... 46
收集的数据的定义 (Definition of Variables) ...................................................................... 46
数据收集过程 (Data Collection) .................................................................................................. 46
备注 (Remarks) ....................................................................................................................................... 46
A4: 人才分布 (Talents in AI) ................................................................................................................ 47
A5.GitHub 开源软件 (Open Source AI Softwares) .......................................................................... 47
主要数据源和数据集 (Data Sources) ........................................................................................... 47
收集的数据的定义 (Definition of Variables) ...................................................................... 47
收集过程 (Data Collection) ........................................................................................................... 47
I
China AI Index 2018
备注 (Remarks) ....................................................................................................................................... 48
A6. 公众认知及媒体报道 (Public Opinions and Media Coverage) ........................................ 49
主要数据源和数据集 (Data Sources) ........................................................................................... 49
收集的数据的定义 (Definition of Variables) ...................................................................... 49
收集过程 (Data Collection) ........................................................................................................... 49
II
2018 中国人工智能指数
2018 中国人工智能指数
陈络、崔晓晖、莫泉、肖蓉、许成钢、杨威
摘要
《2018 中国人工智能指数》从学术、产业、开源软件包使用、公众认知及媒体等方面,
进行中美对比,以此度量中国的人工智能在最近十几年里的发展及影响。以下概要我们的基
本发现:
(1) 中国在人工智能的学术领域发展迅速。在学术期刊及专业会议发表论文的总数方面,
中国呈现快速接近美国的趋势。这一趋势在 2016 之后尤其明显。中国的中、低等引用率的
论文的发表总数,在最近几年快速接近了美国的总数。但在最具原创性最具影响力的极高引
用率和高引用率的论文方面,中国虽有大的进步,与美国的差距仍然相当显著。在没有被引
用的、通常是狭窄应用的研究论文方面,中国的发表总数超过了美国。在人工智能的一些领
域,包括机器学习、文本分析和 NLP、计算机图像与视频分析、虚拟代理及群体智能等,中
国的论文发表总数和被引用总数,在最近几年里大幅度缩小了与美国的差距。但是在深度学
习、机器人流程自动化、以及包括推理学习等在内的其他领域,从发表总数和引用率方面,
与美国的差距都仍然显著。
(2) 在产业领域,在最近二十几年里,中国活跃的人工智能初创公司整体上呈快速发
展趋势,2016 年超过 400 家,达到顶峰。中国活跃的人工智能初创公司数字在 2012 年之前
多于美国,但是在 2012 年以后被美国超越。尤其是在 2016 年之后,中美两国在产业领域的
差距加大。2016 年之后,美国的人工智能初创公司数量快速上升,在 2018 年超过 600 家,
而中国则在 2016 年之后下降,在 2018 年降至不到 200 家。
(3)在人工智能的学术人才方面,除了有特大影响的人才外,中国有能力发表有影响
的(即被引用的)论文的作者人数与美国之间的差距持续缩小。 发表没有被引用的论文的
作者人数,最近几年大幅增加,超过美国。但特大影响(特高引用率)作者的人数显著少于
美国。在人工智能的所有人才,包括学术、产业等所有方面的普遍人才方面,据领英(LinkedIn)
人才数据库,中国的 AI 人才总数为 5 万,而美国的 AI 人才总数为 83 万。
3
China AI Index 2018
(4)我们用关注开源软件包的统计,度量人工智能研发程度的指标。中国在最近三年
里,关注人工智能开源软件包的总数迅速上升,并在 2017 年秋超过了美国。但是,几乎 93%
的中国研究者使用的人工智能开源软件包,是美国的机构开发提供的。中美两国人工智能研
究者使用最多的软件包是 Google 开发的 TensorFlow。在 2018 年初,中美研究人员对此的
关注人数,分别达到将近 9000 人和约 7000 人。
(5) 人工智能的应用处仍然于起步阶段。其广泛应用和发展的前景,以及人们是否能在
人工智能的发展过程中及时纠正偏差,与公共认知高度相关。我们收集的媒体大数据显示,
在 2014 年之前,中国媒体对人工智能的正面报道略多于负面,差距不大。此后,负面报道
持续下降,正面报道逐年增加,全面压倒负面报道。相比之下,全球英语世界的报道,多数
属于没有正负之分的中性。在 2013 年到 2015 年之间,正负报道之间的差距曾经大幅度缩小。
在 2016 之后,正面报道大幅度提高,而负面报道则没有显著变化。 这个趋势与 2016 年之
后美国人工智能投资初创企业的快速增长高度相关。
4