王咏刚：AI领域美国不是世界第一？那是谁

APP下载

扫一扫

下载观察者APP

王咏刚：AI领域美国不是世界第一？那是谁
- 王咏刚创新工场AI工程院副院长
分享到：

2016-10-17 10:52:24 字号：A- A A+ 来源：作者微博

关键字: 人工智能AI深度学习

人工智能这把火已经烧到了国家战略层面，连美国总统和政府机构也卷了进来。上周四，奥巴马主持白宫前沿峰会，展望美国在未来50年的发展。峰会中，白宫发布报告《国家人工智能研究与发展策略规划》。相关情况，大家可以参考《连线》杂志的总统专访（Barack Obama on Artificial Intelligence, Autonomous Cars, and the Future of Humanity）。

这两天，自媒体没少炒作这个报告；我自己呢，倒是特别地对这个报告中的两张趋势图感兴趣。报告中说，从2013年到2015年，SCI收录的论文里，提到“深度学习”的文章增长了约六倍，同时强调，“按文章数计算，美国已不再是世界第一了。”

美国不是世界第一？谁是世界第一呢？来看报告中的两张趋势图：

上图是每年SCI收录的文章里，提到“深度学习”或“深度神经网络”的文章数量变化趋势，同时按国家做了区分。数据本身是从Web of Science核心数据库里查询得到的。

第二张图和第一张图其他条件一样，只是增加了一个“文章必须至少被引用一次”的附加条件。也就是说，第二张图统计的文章数，是被引用过的“有效文章数”，相对来说更合理一些。

两张图里，中国都在2014年和2015年超过了美国（以及其他所有第二梯队的国家），居于领跑者的位置。

问题来了，在AI研究领域，中国人真有这么强吗？

从这些年的直觉看，中国人/华人在人工智能领域里的大牛比比皆是，吴恩达、孙剑、杨强、黄广斌、马毅、张大鹏 ……随口可以说出一大串，我自己在Google的研究团队，微软研究院等地亲眼看到的，也到处是中国人、华人的面孔。但这只是直观感受。整体来看，中国人/华人所做的科研贡献到底有多重要，对人工智能的推动作用到底有多大？白宫报告里的统计是不是科学、合理？

其实，对美国国家战略规划里的统计，我自己是有几个疑问的，主要包括：

·直接搜索关键字“深度学习”、“深度神经网络”，真的能涵盖这些年人工智能领域的所有科学研究进展？像机器人、智能控制、机器视觉、无人驾驶等领域里，没有提及深度学习的文章眼见还有不少。严格按关键词匹配会漏掉多少相关文章？是否影响统计结果？

·“文章至少被引用一次”，比较科学，但好像还远远不够。这种统计，真的不需要考虑SCI的影响因子吗？不考虑的话，会混进多少较差期刊上发表的比较水的论文？这些数据会不会被国内研究机构靠SCI引用数来评职称的风气污染？

·在全球化时代，按国家统计，会不会有明显偏差？白宫报告没有提到被统计的文章是如何归入不同国家的。如果按作者发表文章时的所在机构，那大量在国外机构访问的中国学者会不会被算成外国人？中国人和外国人合写的文章该如何统计？如果按期刊所属国家和地区，那不同国家间的期刊水平（影响因子）差异是不是会让统计结果带有偏见？

基于此，我也想自己去做个统计。

统计前，给自己设了几条原则：

·从期刊的影响因子出发，只统计影响因子高的顶尖期刊。

·从Web of Science主题词出发，涵盖人工智能相关的所有科研领域，而不仅是深度学习方面的文章。

·关注对象是华人，而不是用国家分类的办法去比较中国和外国——这个是我自己的选择，因为今天的学术界，国家间的合作和交流已不可忽视。类似吴恩达这样的外籍华人，其实也在为中国的人工智能发展做贡献。与其限定国家，不如从整体上看一看，地球上的华人科学家、研究者群体，到底有多厉害。

·关注时间范围是2006到2016年，跨度10年左右——因为许多人说，这一波人工智能大潮是从2006后的几年时间里，才开始真正兴起的。

我的统计结果

先说说我的统计结果，一会儿会在附录一中讲讲我用的统计方法。

来看下2006到2016年间华人作者的平均贡献：

在2006到2016年的时间段里，近两万篇最顶级的人工智能文章中，由华人贡献的文章数和被引用数，分别占全部数字的29.2%和31.8%。近十年，华人用五分之一左右的作者人数，平均贡献了三成的顶级AI研究文章和被引用数。统计角度，这已经是超出平均水平的科研贡献了。

但平均数并不能看出华人科学家、研究者在最近几年的发力程度。来看2006到2015年间，华人贡献的文章数和被引用数的变化趋势：

2006到2015年间，华人作者参与的顶级AI论文，占全部顶级AI论文数量的比例，从23.2%逐年递增到42.8%。而华人作者参与的顶级AI论文被引用次数，占全部顶级AI论文被引用次数的比例从25.5%逐年递增到55.8%（2016 年数据较少，未用于趋势比较）。

也就是说，即便只统计顶级出版物里的顶级文章，中国人/华人在人工智能领域的贡献，在发展趋势上也和白宫报告中揭示的规律如出一辙——无论从哪个角度来说，中国人/华人正在人工智能领域里发挥举足轻重的作用，而且，从2014年，2015年开始，中国人/华人已经处于人工智能研究的领先地位，占据了人工智能科研世界的半壁江山！

个案分析

会有人觉得这个统计很不可思议吗？这个结果会出乎很多人意料吗？我们还可以拿一个更具体的例子，来深入分析一下。

在顶级人工智能期刊和会议录里，我来举个大名鼎鼎的例子吧：IEEE模式分析与机器智能汇刊（IEEE Transactions on Pattern Analysis and Machine Intelligence，简称PAMI），2015年影响因子6.077，高到没朋友，想往这里投稿的同学可能都知道被接受和发表的难度有多恐怖。

我从《IEEE模式分析与机器智能汇刊》里按引用数选出2006到2016年间的前500篇论文，下面是这500篇论文的引用数分布情况：

其实很恐怖的，前500篇文章最高引用数2715，最低引用数41——真顶级期刊！普通期刊难以望其项背呀。

那么，这500篇最顶级的人工智能论文里，华人科学家、研究者的贡献如何呢？先说几个数字：500篇顶级文章的作者一共1220人，其中华人科学家、研究者316人，占25.9%。所有作者单独累加计算的被引用数总和是231361次，其中，华人科学家、研究者被引用数总和是63846 次，占27.6%。如果单看2014年（当年华人的文章数、引用数均较高）的数据，华人科学家、研究者被引用数占51.8%，超过了半数。

如果只看《IEEE模式分析与机器智能汇刊》在2006到2016年间，引用数最多的10位华人作者和10位非华人作者的具体情况，也是一个很有趣的表格：

《IEEE模式分析与机器智能汇刊》的华人前10位大牛，与非华人前10位大牛，在每个人的总引用数上几乎不相上下。的确，最顶尖的人工智能科学家里，中国人/华人的贡献丝毫不亚于其他科学家。

另外，如果对人工智能特别是模式识别的研究领域不熟悉，那么，记住表中这20位顶尖科学家的名字吧。有兴趣的话，大家可以去搜一搜他们的简历，看看他们都在哪里工作，在哪里做研究，他们的学生、同事都是谁，相信会有很多发现。

原因？

为什么中国人/华人在人工智能领域这么强？因为数学好？因为兴趣使然？因为思维习惯？因为勤奋？因为教育？大家可能都有自己的答案。

本文不想展开讨论，列举数据和事实，才是本文的目的。

1 2 下一页余下全文
标签人工智能科技创新论文
- 原标题：AI领域，中国人/华人有多牛？
- 请支持独立网站，转发请注明本文链接：
- 责任编辑:孙武
搜索

   观察者头条查看全部

特鲁多迎来“最后一天”，特朗普成了“意外救星” 评论 15

“特朗普政府已通知盟友，将停止参加欧洲未来军演” 评论 68

默茨急剧掉头，“这是典型的‘尼克松访华时刻’” 评论 168

对欧洲“感到愤怒”，“特朗普想把驻德美军全撤走” 评论 184

特朗普威胁“不谈就打”，伊朗最高领袖表态评论 325

   风闻 · 24小时最热查看全部

   最新视频查看全部
最新闻 Hot
快讯

王咏刚：AI领域美国不是世界第一？那是谁

欧洲多国惊觉：被美国掌握一个“致命开关”

对欧洲“感到愤怒”，“特朗普想把驻德美军全撤走”

纽约发生多起山火，纽约州进入紧急状态

特朗普威胁“不谈就打”，伊朗最高领袖表态

“乌克兰半瞎了，欧洲急了”

尹锡悦获释第二天，首尔10万民众集会游行

美媒哀叹：所谓的“西方”，已荡然无存

“1500亿欧元贷款计划，法德又吵起来了”

“看看中国高铁再看美铁，尬死了”

特朗普怒砍哥大4亿美元：打击“反犹”不给力啊

“特朗普想重新划定美加边界”

“鲁比奥与马斯克干架了”，特朗普忙灭火

“因为我是美国人，在台积电被骂又懒又蠢”，下月开庭

“普京愿意，但有条件”

“最大受害者是波音，中国要么用国产，要么买空客”

特朗普：和乌克兰打交道比和俄罗斯更难