人工智能评价分析报告(2021).pdf
2021 全球人工智能领域评价分析报告 序 创新是引领发展的第一动力,也是建设现代化经济体系的战略支 撑。国务院 2017 年印发的《新一代人工智能发展规划》提出“人工 智能成为国际竞争的新焦点” 、 “人工智能成为经济发展的新引擎” 、 “人工智能带来社会建设的新机遇”。合理并有效运用人工智能这一 影响面广的颠覆性技术,大力发展人工智能新兴产业,有助于我国加 快建设创新型国家和世界科技强国。 2002 年开始,在教育部的支持下,中美大学合作投入约 1 亿美 元,成功数字化了近 300 万册图书,目前年度服务用户已达到 2.5 亿 次。2012 年,中国工程院看准国内外大数据的趋势,着手建设工程科 技领域的大数据项目,即中国工程科技知识中心(简称“知识中心”), 目前知识中心也已在中国工程院建设国家高端智库过程中发挥了重 要作用。通过两个项目的建设我们发现,数据之间的关联融合会产生 大量新的知识,科技创新往往亟需这些融合后的知识,而海量数据的 关联融合离不开人工智能技术的发展。 为了更好地从全球视角了解人工智能产业布局、发展态势,浙江 大学信息资源分析与应用研究中心在知识中心项目的资助下,从 2019 年开始每年发布《人工智能发展水平评价分析报告》。项目组以建设 中的“中国工程科技专家库”海量成果数据为分析基础,结合人工智 能领域科技产出、资金投入、产业发展、专家和学科排名六个维度, 提出了人工智能影响力评价指标体系,并从宏观国家层面、中观机构 层面和微观学者层面进行计量分析,全面展示全球人工智能领域研究 重点、机构与人才布局等。 “知不足,然后能自反也;知困,然后能自强也”,我们希望通 过长期的数据积累和周期性的评价分析,梳理出人工智能领域的变化 态势和发展趋势,为科研人员和咨询工作者提供参考,推动我国成为 世界主要人工智能创新中心。 i 2021 全球人工智能领域评价分析报告 目 前 录 言.......................................................................................................................... 1 一、研究方法和数据.................................................................................................... 2 1.1 研究方法......................................................................................................... 2 1.2 指标体系......................................................................................................... 2 1.3 主要计量指标解释......................................................................................... 3 1.4 数据来源......................................................................................................... 4 二、国家发展水平分析................................................................................................ 6 2.1 人工智能十二国发展情况比较分析.............................................................. 6 2.2 国家科技创新能力分析................................................................................. 8 2.2.1 学术创新活力..................................................................................... 13 2.2.2 学术创新水平..................................................................................... 14 2.2.3 学术领先水平..................................................................................... 15 2.3 洲际发展概览............................................................................................... 22 三、国别个案分析...................................................................................................... 26 3.1 中国................................................................................................................ 26 3.2 美国................................................................................................................ 30 3.3 印度................................................................................................................ 32 3.4 韩国................................................................................................................ 34 四、机构和学者分析.................................................................................................. 39 4.1 科研机构分布............................................................................................... 39 4.2 企业分布....................................................................................................... 40 4.3 学者分布....................................................................................................... 41 ii 2021 全球人工智能领域评价分析报告 前 言 浙江大学信息资源分析与应用研究中心(简称:CIRAA)自 2019 年始,每年发布《人工智能发展水平评价分析报告》,以追踪国际人 工智能发展态势。创新是引领发展的第一动力,是建设现代化经济体 系的战略支撑。合理并有效运用人工智能这一引领诸多领域产生颠覆 性变革的使能技术,意味着价值创造和竞争优势。今年为课题组第四 次发布,为了更好地从国际视角了解各国人工智能产业布局,以及科 研人员在人工智能领域所做的尝试、研究现状和成果,本中心运用文 献计量和指标数据建模分析法对人工智能创新主体进行剖析,从宏观 国家层面、中观机构层面和微观学者层面进行多维度计量分析,并可 视化展示国际人工智能领域研究重点,机构与人才布局,以期为人工 智能科研机构和学者提供数据参考。 从宏观国家层面来看,报告发现中国 2021 年的人工智能影响力 在十二国中名列第二。美国各项指标分值遥遥领先,只有专利稍逊中 国。英国总排名第三,专利是英国的短板,分值位列第九。单从 G20 国家科技产出(论文)来看,中美发文和引文均远超其他国家。令人 意外的是,印度发文量仅次中美,位列第三,引文总量排名第九;沙 特阿拉伯的发文年均加速度最高,发文上升势头较快。大多数国家的 发文加速度在 2019 年达到顶峰,G20 国家发文年均加速度的平均值 基准线为 13.52%,有七个国家超出基准线。G20 国家篇均被引的平 均值基准线为 8.73%,有十个国家超出基准线。从洲际发展来看,亚 洲发文和引文量最多,但篇均被引最低,北美洲发文和引文量排名第 二,但篇均被引最高;欧洲发文和引文量最少,但篇均被引位列第二。 从中观机构层面和微观学者层面,报告解析了全球人工智能科研 机构分布、企业分布和学者分布,发文和引文 TOP100 的研究机构, TOP50 的企业,以及 TOP100 学者国别分析中,中国和美国以绝对优 势位居前 2 位。此外,报告选取中国、美国、印度、韩国做深入案例 分析,从而从微观层面近距离挖掘出不同国家 AI 领域的主要研究方 向、学科属性、机构分布状况及研究热点。 1 2021 全球人工智能领域评价分析报告 一、研究方法和数据 1.1 研究方法 报告从人工智能(Artificial Intelligence,简称:AI)科技产出(论文 和专利)、资金投入、产业发展、专家和学科排名六个维度综合调研 人工智能创新主体。文献计量和指标数据建模分析是本报告两个主要 研究方法。文献计量法是指运用数学和统计学,定量地分析一切知识 载体的方法。本报告文献计量的主要对象是人工智能科技产出(学术 论文,技术专利)、人才投入、各国资金投入、产业发展状况、学科 排行情况、文献关键词和 AI 研究领域类目分布等,从而多维度评价 人工智能领域创新主体。 指标数据建模分析一般分为 2 个步骤:一是根据采集到的原始数 据特点,进行数据归一化等预处理;二是依据评价领域特征,选择适 当模型及赋予各指标权重,从各个维度综合评价分析本体。 1.2 指标体系 课题组经过对国内外人工智能著名排行榜指标体系对比分析,并 结合指标评价原则,提出了自己的人工智能评价指标体系(表 1), 包括 6 个一级指标,24 个二级指标。 表 1 人工智能影响力评价指标 序号 1 一级指标 产业 2 3 资金 二级指标 CB insights-AI100 企业数量 公司市值或估值 人工智能领域国家经费总数 4 TOP1000 人工智能专家学者论文总被引 5 TOP1000 人工智能专家数量 6 顶尖专家 TOP1000 人工智能专家论文人均被引 7 图灵奖数量 8 AI 研究人员数量 9 QS 2021 TOP100 高校 AI 教授数量 10 AI 申请量 专利 AI 授权量 11 2 2021 全球人工智能领域评价分析报告 序号 一级指标 二级指标 12 全行业授权量 13 AI 授权专利/全行业授权专利 14 TOP10 数量 15 TOP50 数量 学科排名 16 TOP100 数量 17 总量 18 总量-WoS 19 总被引-WoS 20 篇均被引-WoS 21 论文 总量-会议论文 22 总被引-会议论文 23 篇均被引-会议论文 24 TOP 刊发文数量 1.3 主要计量指标解释 ⚫ Web of Science 核心合集数据库:主要包括 WOS 引文索引 6 个(SCI、SSCI、A&HCI、CPCI-S、CPCI-SSH、ESCI)和化 学索引 2 个(CCR-EXPANDED 和 IC); ⚫ Web of Science 类别( Web of Science Category):针对 Web of Science 核心合集的记录所做的分类标引,总共有 254 个类 别; ⚫ 发文数量(Publications),即学者在指定时间范围内(20112020 年)的发文数量; ⚫ 被引次数(Citations),即学者在指定时间范围内(2011-2020 年)发文的被引次数; ⚫ 高被引论文(Highly Cited Paper):是指按照同一年,同一个 ESI 学科发表论文的被引用次数按照由高到低进行排序,排 在前 1%的论文; ⚫ CPP:篇均被引次数(Citations per publication),即学者在指 定时间范围内单篇发文的被引次数的平均值; ⚫ 发文加速度: 3 2021 全球人工智能领域评价分析报告 定义为:当年发文加速度(%) = 当年发文数−上一年发文数 上一年发文数 ∗ 100%, 此处用来表征学术创新活力。 ⚫ 高被引论文占比:即在指定时间范围内(比如:2016-2020 年),高被引论文量在发文总量中的占比。此处是用来衡量 “学术领先水平”的一个维度。 1.4 数据来源 指标数据获取过程中,注重数据的公开、客观、真实、可获得性, 通过检索论文数据库、专利数据库、相关排行榜等公开途径,获得了 用于计算榜单排名的大量客观事实数据。 (1)人工智能学术论文 本报告主要关注人工智能前沿研究情况,因此,数据源选取 Web of Science(以下简称:WoS)数据库核心合集的数据。学术会议也是 人工智能领域科研活动不可或缺的环节,因此本部分的数据集还包含 WOS 学科 AI 领域中所涵盖的会议论文数据。具体数据集构建步骤如 下: 1) 在 Web of Science 核心合集数据库中检索收录在 AI 领域顶级 期刊(《Artificial Intelligence》、 《IEEE Trans on Pattern Analysis and Machine Intelligence》、《International Journal of Computer Vision》、《Journal of Machine Learning Research》)2011-2021 十年间的所有文献(文献类型限定为:Article、Review 和 Proceedings Paper)共计 5,252 篇,提取上述文献的关键词, 并从 13,435 对共现关键词对中筛选出 2,139 对关键词, 在 WoS 核心合集数据库中检索,获得近 5 年(2016-2021 年)发表的 文献 950,048 篇。 2) 在 WoS 核心合集数据库的会议标题字段中检索“Artificial Intelligence”,限定“出版年:2016-2021”,获得会议论文 39,438 篇。 将以上两个数据源合并后,形成本报告分析的数据基础——全球 人工智能论文数据集,以下简称“AI 数据集”,共计 975,289 篇。 (2)专利数据库 4 2021 全球人工智能领域评价分析报告 本报告的专利数据来自 Derwent Innovation 专利数据库(该数据 库涵盖中国知识产权局、欧洲专利局、美国专利局、日本专利局等 40 余家专利局信息),获取每个国家 2011-2020 年近 10 年人工智能领 域专利申请量、专利授权量、全行业专利授权量等二级指标数据共计 2,266 万条。 (3)学科排行榜 学科排行榜可从侧面反映国家对某个学科在教育层面的投入,但 由于学科指标设置不同,排名会有差异。项目组选取了 USNEWS、 ARWU、QS、THE、ESI 五个主流排行榜官网,由于在各大学科排行 榜中均未设置人工智能学科排行榜,故以计算机学科入手,收集各国 计算机相关学科进入排行榜的机构总量、TOP10 数量、TOP50 数量、 TOP100 数量四个二级指标。 (4)人工智能领域国家经费 国家经费是资源投入的直接体现。经费数据来源以科慧(SciFund)平台、各国项目数据库人工检索为主。以美国 NSF、NIH、SBIR 基金,英国 RCUK、UKRI、MRC、EPSRC 基金,日本 JST、 JSPS 基 金、加拿大 CFI、 CIHR、NSERC 基金,澳大利亚 NHMRC、ARC 基 金,法国 ANR 基金,以色列 ISF 基金等各国理事会、基金会项目库为 数据来源,检索各国资助的人工智能项目及其经费情况。 (5)人工智能人才 顶尖专家网站:分别从 QS 排名各大高校官网、图灵奖、学术网 站 Guide2Research 四类国际人才专家网站上,获取顶尖专家数据,包 括 2011-2020 年 AI 研究人员数量、QS2021TOP100 高校 AI 教授数 量、1966-2020 年图灵奖专家总量、学术网站 Guide2Reseach 人工智 能领域的前 1000 名专家数量以及专家影响力。 (6)引用其他报告数据 公司市值或估值、人工智能产业产值指标数据引用已有人工智能 报告,其中公司市值或估值从 CB Insights 发布的 2021 AI 100 Startups 榜单中获取每个国家 AI 公司市值或估值数据。 5 2021 全球人工智能领域评价分析报告 二、国家发展水平分析 2.1 人工智能十二国发展情况比较分析 本部分从人工智能科技产出(学术产出和技术专利)、资金投入、 产业发展、专家和学科排名六个维度来综合调研中国、美国、英国、 加拿大、德国、法国、日本、澳大利亚、以色列、印度、新加坡、韩 国十二个国家人工智能发展的状况。在指标数据预处理阶段,本课题 组针对数量级相差较大的指标数据,引入对数变换,消除数量级相差 较大的情况,从而使得倾斜分布尽可能的接近正态分布。随后,进行 数据补全及赋予权重等数据预处理。 建模阶段,课题组最终选择线性加权法对评价对象的总评价目标 进行评价,依其大小来确定评价对象的优劣。该方法使复杂的问题系 统化、数学化和模型化,将以人的主观判断为主的定性分析定量化。 将各种判断要素之间的差异数值化,帮助人们保持思维过程的一致性。 按照以上数据处理方法和权重分配,计算得到各指标的分项得分 和总得分,并将十二国人工智能各项分值进行对比分析,如表 2 所示。 表 2 人工智能影响力排行榜(2020-2021 年对比) 顶尖 产业- 产业- 资金- 国家 2021 2020 2021 顶尖 资金 专利 专家 专家- -2021 2020 -2020 -2021 学科 学科 排名 排名- -2021 2020 专利 -2020 论文 论文 总得分 总得分 排名- 排名 -2021 -2020 -2021 -2020 2021 -2020 美国 23.07 23.075 13.85 13.84 13.85 13.84 8.46 8.46 13.84 13.84 18.46 18.46 91.53 91.53 1 1 中国 21.15 19.225 12.69 11.53 12.69 9.225 9.23 9.23 12.69 12.69 16.92 16.92 85.37 78.825 2 2 英国 19.23 21.15 11.54 12.69 11.54 12.69 2.3 2.3 11.53 11.53 15.38 15.38 71.51 75.745 3 3 加拿大 17.3 17.3 10.38 10.38 10.38 11.53 5.38 4.61 10.38 10.38 12.3 12.3 66.12 66.505 4 4 德国 9.6 13.45 6.915 9.225 9.225 8.07 4.61 5.38 5.76 5.76 13.84 13.84 49.95 55.725 5 5 法国 7.68 11.525 4.605 6.915 8.07 6.915 3.84 3.84 6.92 8.07 10.76 10.76 41.86 48.025 6 6 1.9 1.9 5.76 8.07 6.915 5.76 6.15 6.15 9.225 9.225 9.22 9.22 39.17 40.325 7 7 以色列 15.38 15.375 8.07 5.76 5.76 10.38 0.76 0.76 1.14 1.14 6.14 6.14 37.24 39.555 8 8 韩国 11.53 1.9 9.225 2.295 1.14 2.295 7.69 7.69 2.295 3.45 3.06 3.06 34.94 19.535 9 11 澳大利 亚 6 2021 全球人工智能领域评价分析报告 顶尖 产业- 产业- 资金- 国家 2021 2020 2021 顶尖 资金 专利 专家 专家- -2021 2020 -2020 -2021 学科 学科 排名 排名- -2021 2020 专利 -2020 论文 论文 总得分 总得分 排名- 排名 -2021 -2020 -2021 -2020 2021 -2020 日本 13.45 9.6 1.14 1.14 2.295 1.14 6.92 6.92 4.605 4.605 4.6 4.6 33.01 29.16 10 9 新加坡 1.9 1.9 2.295 2.295 4.605 2.295 1.53 1.53 8.07 6.915 7.68 7.68 26.08 23.771 11 10 印度 1.9 1.9 2.295 2.295 3.45 2.295 3.07 3.07 3.45 2.295 1.52 1.52 15.68 15.685 12 12 人工智能影响力排行榜 2020 版与 2021 版对比来看(详见表 2),美国仍保持强劲的领先势头,在六个一级指标中,除了专利指 标稍逊中国,其余指标分值都遥遥领先。中国 2021 年的人工智能影 响力表现在十二国中依然名列第二,但其产业指标、资金指标、专家 指标分值都所有增长,其中,专利指标表现仍然突出,位列第一。英 国虽然产业、资金、顶尖专家的分值较 2020 年有所下滑,但仍然名 列第三名,专利仍然是英国的短板,分值位列第九。加拿大、德国、 法国、澳大利亚、以色列、印度总体得分基本与 2020 年持平,排名 不变。韩国产业、资金分值大幅提升,排名上升 2 位,位列第九名。 日本产业、顶尖专家分值有所提升,但提升幅度不如韩国,故排名下 降一位,位列第十。新加坡顶尖专家和学科排名分值有所提升,但提 升幅度不如韩国,位列第十一。 7 2021 全球人工智能领域评价分析报告 2.2 国家科技创新能力分析 本中心通过对 AI 数据集进行国别拆分,获得 G20 除欧盟之外的 19 个国家和上文 2.1 人工智能十二国家中未入选 G20 的新加坡、以 色列共 21 个的国家,如图 1 所示,这 21 个国家贡献发文量共计 789,650 篇,占总文献集的 80.97%。从总量上看,中国(含台湾地区) 和美国的发文量遥遥领先,且中国的发文量已经超过了美国,印度排 名第三,英国和德国发文量相当,分列第四和第五,排名第六的加拿 大(发文 39,454 篇)与排名第十一的日本(发文 32,154)数量相差不 大。 中国 283617 美国 207826 印度 61554 英国 54575 德国 53487 加拿大 39454 法国 37240 意大利 35983 澳大利亚 34306 韩国 32520 日本 32154 巴西 21536 土耳其 17086 俄罗斯 16350 新加坡 12601 沙特阿拉伯 11784 墨西哥 7243 以色列 6283 印度尼西亚 5902 南非 5124 阿根廷 2728 0 50000 100000 150000 200000 250000 图 1 全球人工智能 21 个国家发文量统计(2016-2021 年) 8 300000 2021 全球人工智能领域评价分析报告 从人工智能领域 21 个国家的发展趋势图来看(图 2),虽然有些 期刊的入库时间滞后,导致 2021 年文献量统计尚不完全,但各国的 发文量总体呈上升趋势,并且中国、印度、英国、韩国、澳大利亚、 土耳其、新加坡和沙特阿拉伯的 2021 年尚未完整的发文量已超过 2020 年。 70000 60000 50000 40000 30000 20000 10000 0 2016 2017 2018 2019 2020 2021 中国 27028 33208 41021 54076 62373 65911 美国 24749 28698 33598 40037 41433 39311 印度 7070 8595 9244 10625 12939 13081 英国 6331 7266 8442 10188 11100 11248 德国 6565 7504 8486 10124 10421 10387 加拿大 4622 5194 6101 7351 8167 8019 韩国 3045 3618 4577 6009 7396 7875 意大利 4334 4959 5302 6471 7467 7450 澳大利亚 3851 4509 5178 6396 7011 7361 法国 5001 5568 6062 6938 7015 6656 日本 2327 2934 3465 4052 4488 4270 土耳其 1812 2293 2595 3077 3651 3658 俄罗斯 1549 2423 2948 3400 3306 2724 新加坡 1573 1725 1976 2309 2480 2538 沙特阿拉伯 840 1073 1316 1896 2855 3804 墨西哥 847 982 1183 1304 1520 1407 以色列 838 898 1004 1206 1169 1168 印度尼西亚 585 1069 1238 1257 926 827 南非 551 683 754 1024 1089 1023 阿根廷 349 427 485 463 511 493 图 2 全球人工智能领域 21 个国家发文发展趋势(2016-2021 年) 9 2021 全球人工智能领域评价分析报告 由于中美两国的发文量遥遥领先,占据了图 2 的大部分位置,为 了更好地观察其余国家的发文发展趋势,故另作了其余 19 国的发文 发展态势图(图 3)。其中,印度、英国、德国、韩国和沙特阿拉伯 在 2018 年后发展态势较快。 14000 12000 10000 8000 6000 4000 2000 0 2016 2017 2018 2019 2020 2021 印度 7070 8595 9244 10625 12939 13081 英国 6331 7266 8442 10188 11100 11248 德国 6565 7504 8486 10124 10421 10387 加拿大 4622 5194 6101 7351 8167 8019 韩国 3045 3618 4577 6009 7396 7875 意大利 4334 4959 5302 6471 7467 7450 澳大利亚 3851 4509 5178 6396 7011 7361 法国 5001 5568 6062 6938 7015 6656 日本 2327 2934 3465 4052 4488 4270 土耳其 1812 2293 2595 3077 3651 3658 俄罗斯 1549 2423 2948 3400 3306 2724 新加坡 1573 1725 1976 2309 2480 2538 沙特阿拉伯 840 1073 1316 1896 2855 3804 墨西哥 847 982 1183 1304 1520 1407 以色列 838 898 1004 1206 1169 1168 印度尼西亚 585 1069 1238 1257 926 827 南非 551 683 754 1024 1089 1023 阿根廷 349 427 485 463 511 493 图 3 全球人工智能领域除中美之外 19 个国家发文发展趋势(2016-2021 年) 10 2021 全球人工智能领域评价分析报告 就引文影响力而言,21 个国家中,美国和中国(含台湾地区)的引文总量也远超其他国家,位居第一、二位, 英国和德国的引文总量都在 50 万次以上,分列第三、四名(图 4)。值得注意的是,澳大利亚发文总量第九,但引 文总量名列第五;新加坡发文总量排名第十五,但引文总量名列第十二;相反地,印度虽然发文总量第三,但引文 总量排名第九。 300000 3000000 250000 2460600 2500000 2311285 200000 2000000 150000 1500000 100000 1000000 695721 557110 50000 0 434220 20418 43581 15571 63424 44812 104285 189837 69698 105253 142666 222609 267969 363069 365053 432965 500000 349460 0 发文总量 引文总量 图 4 全球人工智能领域 21 个国家发文和引文总量统计(2016-2021 年) 11 2021 全球人工智能领域评价分析报告 表 3 列举了全球人工智能领域 21 个国家参与发文的人数和人均 发文数,中国(含台湾地区)有 672,476 学者参与发文,位居第一; 结合图 1 的各国发文总数计算人均发文量,印度尼西亚以人均发文 0.85 篇排名第一,新加坡人均发文 0.75 篇,中国与美国的人均发文 数量相近。 表 3 全球人工智能领域 21 个国家的发文人数和人均发文数(2016-2021 年) 国家/地区 学者人数 人均发文 中国 美国 德国 印度 法国 英国 意大利 日本 加拿大 巴西 韩国 澳大利亚 俄罗斯 土耳其 墨西哥 新加坡 印度尼西亚 沙特阿拉伯 以色列 南非 阿根廷 672476 476980 135548 128882 103517 97282 93973 74808 72838 68897 64186 59446 43450 29326 18931 16709 13893 13617 12139 9334 9050 0.42 0.44 0.39 0.48 0.36 0.56 0.38 0.43 0.54 0.31 0.51 0.58 0.38 0.58 0.38 0.75 0.85 0.43 0.52 0.55 0.30 12 2021 全球人工智能领域评价分析报告 2.2.1 学术创新活力 本报告引入“发文加速度”来衡量一个国家在人工智能领域的学 术创新活力。 定义:当年发文加速度(%) = 当年发文数−上一年发文数 上一年发文数 ∗ 100%。 大多数国家的发文加速度都在 2019 年达到顶峰(详见表 4),随 之发文速度放缓;印度和沙特阿拉伯的发展较其他国家滞后一年,发 文加速度在 2020 年达到顶峰。沙特阿拉伯、韩国、中国(含台湾地 区)、加拿大和墨西哥创新活力势头上扬明显,除了 2021 年之外, 每年都保持着两位数的发文加速度。另外,巴西和俄罗斯的发文加速 度逐年降低,日本、土耳其、印度尼西亚和阿根廷发文态势也逐渐减 缓。 表 4 全球人工智能领域 21 个国家发文加速度(2017-2021 年) 图 5 展示了各国 2017-2021 年发文年均加速度,21 个国家发文年 均加速度的平均值基准线为 13.52%。其中,沙特阿拉伯的发文年均 加速度最高,发文上升势头较快,其次是韩国和中国(含台湾地区), 发文年均加速度分别为 21.23%和 19.85%,土耳其、俄罗斯、南非和 澳大利亚的发文年均加速度也超过了 21 个国家的平均值基准线。 13 2021 全球人工智能领域评价分析报告 13.52% 沙特阿拉伯 35.66% 21.23% 韩国 19.85% 中国 土耳其 15.43% 俄罗斯 14.61% 南非 14.09% 澳大利亚 14.01% 巴西 13.41% 印度 13.39% 印度尼西亚 12.61% 加拿大 11.92% 意大利 11.71% 日本 11.28% 墨西哥 11.15% 新加坡 10.16% 美国 10.11% 德国 9.86% 阿根廷 7.65% 以色列 7.19% 6.13% 法国 0.00% 5.00% 10.00% 15.00% 20.00% 25.00% 30.00% 35.00% 40.00% 图 5 全球人工智能领域 21 个国家的发文年均加速度(2017-2021 年) 2.2.2 学术创新水平 本报告引入学术成果的“篇均被引”来衡量一个国家在人工智能 领域的学术创新水平,21 个国家篇均被引的平均值基准线为 8.73(图 6)。其中,新加坡、英国和澳大利亚以篇均被引 15.07、12.75 和 12.66 分列前三位;美国的发文体量较大,篇均被引暂列第四;其次是加拿 大、德国、以色列、意大利、法国和沙特阿拉伯,都高于 21 个国家 的平均值基准线。中国(含台湾地区)的篇均被引只有 8.15,比韩国 略低,说明中国的发文体量庞大,虽发展态势迅猛,但其论文的引文 影响力,即学术创新水平还有较大的提升空间。 14 2021 全球人工智能领域评价分析报告 8.73 新加坡 15.07 英国 12.75 澳大利亚 12.66 美国 11.84 加拿大 10.97 德国 10.42 以色列 10.09 意大利 10.09 法国 9.80 沙特阿拉伯 8.85 韩国 8.24 中国 8.15 阿根廷 7.48 日本 6.92 巴西 6.62 墨西哥 6.19 土耳其 6.16 印度 5.68 俄罗斯 4.26 印度尼西亚 2.64 0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 16.00 图 6 全球人工智能领域 21 个国家的篇均被引(2017-2021 年) 2.2.3 学术领先水平 本报告以高被引论文,即被引 TOP 1%论文,衡量一个国家在人 工智能领域的学术领先水平。在全球人工智能领域 975,289 篇文献中, 高被引论文占 7,290 篇,其中,中国(含台湾地区)参与的高被引论 文 3,205 篇,数量最多,其次是美国 2,499 篇,另外英国参与发文 872 篇,分布占比 11.96%1, 位居第三(图 7)。 由于大多数论文是合作发文的,即一篇文章有多个国家学者参与合作,论文数会被重复计数,即所有百 分比相加会大于 1。 15 1 2021 全球人工智能领域评价分析报告 图 7 全球人工智能领域 21 个国家的高被引论文国别分布(2016-2021 年) 依据 21 个国家高被引论文国别分布以及文章的被引总量及篇均被引统计数据,本中心绘制了全球人工智能领 域 21 个国家的发文质量综合对比图(图 8),其中横坐标是发文总数,纵坐标是篇均被引,气泡大小表示高被引论 文占比,21 个国家的发文总数均值为 46,636 篇,21 个国家篇均被引的平均值基准线为 8.73。 16 2021 全球人工智能领域评价分析报告 篇均被引 18.00 46,636篇 16.00 新加坡, 2.25% 14.00 英国, 1.60% 澳大利亚, 2.00% 加拿大, 1.37% 12.00 美国, 1.20% 德国, 1.19% 以色列, 1.18% 10.00 8.73 沙特阿拉伯, 1.54% 意大利, 0.99% 南非, 1.09% 8.00 法国, 1.10% 韩国, 0.94% 日本, 0.87% 阿根廷, 1.03% 巴西, 0.62% 6.00 印度, 0.50% 墨西哥, 0.65% 土耳其, 0.67% 4.00 中国, 1.13% 俄罗斯, 0.40% 印度尼西亚, 0.20% 2.00 发文总数 0.00 -50000 0 50000 100000 150000 200000 250000 图 8 全球人工智能领域 21 个国家的发文质量综合对比图(2016-2021 年) 17 300000 350000 2021 全球人工智能领域评价分析报告 从四象限图(图 8)可以看出,美国位于第一象限,发文和篇均被引都远超均值;中国(含台湾地区)发文数 最多,但篇均被引低于 21 国的均值,处于第四象限。由于中美两国的发文量遥遥领先,占据了图 8 的大部分位置, 为了更好地观察其余国家的发文发展趋势,故另作了其余 19 国的发文发展态势(图 9)。 篇均被引 18.00 46636篇 16.00 新加坡, 2.25% 14.00 加拿大, 1.37% 澳大利亚, 2.00% 英国, 1.60% 12.00 意大利, 0.99% 以色列, 1.18% 10.00 南非, 1.09% 8.00 沙特阿拉伯, 1.54% 德国, 1.19% 法国, 1.10% 8.73 韩国, 0.94% 阿根廷, 1.03% 巴西, 0.62% 墨西哥, 0.65% 土耳其, 0.67% 6.00 日本, 0.87% 印度, 0.50% 俄罗斯, 0.40% 4.00 印度尼西亚, 0.20% 2.00 发文总数 0.00 -10000 0 10000 20000 30000 40000 50000 图 9 全球人工智能领域除中美之外 19 个国家的发文质量综合对比图(2016-2021 年) 18 60000 70000 2021 全球人工智能领域评价分析报告 从放大的四象限图(图 9)可以看出,英国和德国也处于第一象限,属于发文数量和质量都表现较好的国家, 且从气泡大小可以看出高被引论文占比较高;印度发文量名列第三,但篇均被引远低于 21 国的均值,处于第四象 限。处于第二象限的有 7 个国家:新加坡、澳大利亚、加拿大、意大利、以色列、法国和沙特阿拉伯,它们的发文 体量虽不突出,但篇均被引均高于 21 国的均值,尤其是新加坡的高被引论文占比达 2.25%,是 21 个国家中最高的, 其次是澳大利亚的 2.00%。其余 9 个国家处于第三象限,说明其发文数量和质量都略逊于其他国家,其中仅南非和 阿根廷的高被引论文占比略高于全球平均水平 1%。 同时,本报告统计了高被引论文在 WoS 数据库中的类目分布,并绘制了排名前二十 WoS 类目分布图(图 10), 除了与人工智能领域具有直接相关性的电气和电子工程、自动化和控制系统、电信等类目外,人工智能研究领域主 要涉及影像科学和照相技术、遥感、环境科学、地球科学、能源和燃料、材料科学等领域。 19 2021 全球人工智能领域评价分析报告 图 10 全球人工智能领域高被引论文排名前二十 WoS 类目分布(2016-2021 年) 20 2021 全球人工智能领域评价分析报告 由于高被引论文更能够反映论文的影响力,本报告统计了全球人 工智能领域高被引论文的被引量排名前二十机构的分布情况(表 5), 其中美国 10 家,英国 4 家,新加坡和中国各 2 家,德国和加拿大各 1 家。除了谷歌公司,其余都是以高校、研究院为代表的科研机构, 而整个 TOP100 机构中也仅有一家企业公司 OpenAI 得以跻身。 值得注意的是,虽然企业的发文不多,但被引次数最高的论文是 2017 年卷积神经网络的经典之作《ImageNet Classification with Deep Convolutional Neural Networks》,由谷歌公司 Krizhevsky, Alex 及被 称为“神经网络之父”、“人工智能教父”的 Hinton, Geoffrey E.和 OpenAI 公司的 Sutskever, Ilya 合著,至今被引 14,730 次。另外,谷歌公司和 伦敦大学学院、约翰斯·霍普金斯大学联合发表的关于用深度学习处 理图像语义分隔的论文《DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs》,至今被引 4,856 次,排名第三。 从研究机构角度看,中科院的胡杰(同属于 Momenta 自动驾驶 公司)、吴恩华、Sun, Gang(同属于 Momenta 自动驾驶公司)和牛 津大学的 Shen, Li 及 Albanie, Samuel 合著的关于全新图像识别结构 的论文《Squeeze-and-Excitation Networks》,至今被引 4,643 次,排 名第四。苏黎世大学、哥本哈根大学和 European Mol Biol Lab 等合著 的关于蛋白互作网络数据库的论文《STRING v11: protein-protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets》,至今被引 4,426 次, 排名第五。剑桥大学发表的关于深度全卷积神经网络架构的论文 《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》,至今被引 4,393 次,排名第六。 表 5 全球人工智能领域高被引论文的 TOP20 机构分布情况 排名 机构 国家/地区 总发文量 总引文量 单篇最高被引次数 1 Chinese Acad Sci 中国 296 44263 4643 2 Stanford Univ 美国 183 39156 3942 3 Univ Toronto 加拿大 98 30409 5744 4 Harvard Univ 美国 89 30016 5744 21 2021 全球人工智能领域评价分析报告 排名 机构 国家/地区 总发文量 总引文量 单篇最高被引次数 5 Univ Oxford 英国 108 26573 4643 6 MIT 美国 120 26244 1024 7 UCL 英国 101 25548 4856 8 Univ Cambridge 英国 85 22831 4393 9 Univ Washington 美国 82 22552 2616 10 Google Inc 美国 12 22145 14730 11 Univ Calif Berkeley 美国 79 21837 2314 12 Nanyang Technol Univ 新加坡 106 21596 2289 13 Johns Hopkins Univ 美国 59 21082 4856 14 Natl Univ Singapore 新加坡 107 19725 2289 15 Imperial Coll London 英国 64 19244 2289 16 Tsinghua Univ 中国 120 19113 531 17 Univ Penn 美国 73 18915 5744 18 Mayo Clin 美国 51 18735 5744 19 Heidelberg Univ 德国 46 18705 4426 20 Univ Calif San Francisco 美国 54 18584 4426 从上述数据分析可以看出,美国保持着较大的发文体量,且保持 着不错的学术创新水平(篇均被引量高),是图 7 唯一在第一象限的 国家,即兼具了论文的数量和质量。中国在发文量、引文量和高被引 论文数量上都遥遥领先,且保持着不错的上升创新活力(发文加速度 快),但在篇均被引、高被引论文占比指标上还落后于其他国家,尤 其在篇均被引上还有较大提升的空间,仅领先于印度。这提示了我国 在量化优先的形势下要转向质化指标的提升。 亚洲的印度和韩国在论文数量上保持着强劲的追赶势头,其中印 度在发文量上仅次于中美两国,韩国的发文年均加速度最高,发文上 升势头较快,但两国在篇均被引、高被引论文占比指标上还处于落后 水平。英国和澳大利亚在论文质量上保持着一定的优势,英国篇均被 引排名第一,高被引论文占比第二,而澳大利亚篇均被引第二,高被 引论文占比第一,在 AI 领域似乎拥有不容小觑的潜力。 2.3 洲际发展概览 G20 除欧盟之外的 19 个国家和上文 2.1 人工智能十二国家中未 入选 G20 的新加坡、以色列共 21 个的国家将其按洲进行分类汇总分 析,其中亚洲的有中国、印度、日本、韩国、新加坡、以色列、印度 22 2021 全球人工智能领域评价分析报告 尼西亚和沙特阿拉伯,北美洲的有美国、加拿大和墨西哥,欧洲的有 英国、德国、法国、意大利、土耳其和俄罗斯,另外南美洲的巴西和 阿根廷,澳洲的澳大利亚,非洲的南非发文体量都较少,在 4 万篇以 下,这里仅对亚、欧、北美三洲进行比较分析。从表 6 可见,亚洲(包 括 8 个国家)发文量和引文总量最多,但篇均被引最低;北美洲(包 含 3 个国家)发文量和引文总量排名第二,但篇均被引最高;欧洲(包 含 6 个国家)发文体量是三个洲之中最少的,但篇均被引还不错,位 列第二。 表 6 全球人工智能关注国家所在大洲的发文和引文统计(2016-2021 年) 大洲 亚洲 北美洲 欧洲 发文量 414029 244987 194562 引文总量 3164105 2775036 1792381 篇均被引 7.64 11.33 9.21 由图 11 可见,亚、欧、北美三洲的发文加速度在前三年发展迅 猛,尤其是亚洲,但三大洲都在 2019 年达到顶峰,随之发文速度放 缓,北美洲和欧洲的发文趋势下降得更明显。 30.00% 25.00% 20.00% 27.33% 23.76% 17.56% 15.37% 19.77% 17.20% 14.92% 12.67% 15.00% 18.89% 18.65% 亚洲 10.00% 6.48% 4.87% 5.00% 北美洲 4.05% -2.80% 0.00% 2017 2018 2019 2020 2021 -5.00% -4.85% -10.00% 图 11 全球人工智能关注国家所在大洲的发文加速度(2017-2021 年) 23 欧洲 2021 全球人工智能领域评价分析报告 为比较三大洲人工智能研究的侧重点,本中心整理了亚、欧、北 美三洲在人工智能领域发文排名前二十的 WoS 类目比较表(表 7)。 从表中可见,三大洲排名前七的 WoS 类别都一样,只是排名顺序略 有上下偏差。亚洲较之其他两大洲在电信、自动化和控制系统、设备 和仪器、光学、遥感、能源和燃料、机械工程这 7 个领域发文占比排 名较靠前;北美洲在放射学、核医学和医学成像、生物医学工程、统 计学和概率、神经科学、机器人学、数学和计算生物学这 6 个领域发 文占比排名比其他两大洲靠前;欧洲在计算机科学,理论和方法、应 用物理学、环境科学和应用数学这 4 个领域发文占比排名领先于其他 两大洲。 24 2021 全球人工智能领域评价分析报告 表 7 全球人工智能关注国家所在大洲的 TOP20 WoS 类目占比比较 亚洲 序号 WoS 类别 北美洲 WoS 类别占比 WoS 类别 欧洲 WoS 类别占比 WoS 类别 WoS 类别占比 1 电气和电子工程 29.20% 电气和电子工程 19.35% 电气和电子工程 18.27% 2 计算机科学,人工智能 16.95% 计算机科学,人工智能 13.46% 计算机科学,人工智能 14.16% 3 计算机科学,信息系统 13.81% 计算机科学,信息系统 8.26% 计算机科学,理论和方法 8.05% 4 电信 11.20% 计算机科学,理论和方法 8.15% 计算机科学,信息系统 7.40% 5 计算机科学,理论和方法 10.79% 电信 5.57% 电信 5.32% 6 自动化和控制系统 6.21% 计算机科学,跨学科应用 5.57% 计算机科学,跨学科应用 5.29% 7 计算机科学,跨学科应用 5.44% 自动化和控制系统 4.07% 自动化和控制系统 4.58% 8 影像科学和照相技术 5.17% 放射学、核医学和医学成像 4.06% 影像科学和照相技术 4.30% 9 计算机科学,软件工程 4.50% 影像科学和照相技术 3.85% 计算机科学,软件工程 3.44% 10 多学科材料科学 4.25% 生物医学工程 3.58% 多学科材料科学 3.32% 11 多学科工程 3.81% 计算机科学,软件工程 3.47% 生物医学工程 2.96% 12 设备和仪器 3.49% 统计学和概率 2.95% 放射学、核医学和医学成像 2.95% 13 光学 3.42% 多学科材料科学 2.90% 应用物理学 2.94% 14 应用物理学 3.33% 光学 2.79% 多学科科学 2.93% 15 遥感 3.17% 多学科科学 2.76% 环境科学 2.74% 16 环境科学 3.12% 神经科学 2.66% 遥感 2.60% 17 能源和燃料 2.87% 计算机科学,硬件和体系结构 2.57% 神经科学 2.58% 18 计算机科学,硬件和体系结构 2.82% 环境科学 2.48% 应用数学 2.58% 19 机械工程 2.73% 机器人学 2.17% 光学 2.43% 20 多学科科学 2.28% 数学和计算生物学 2.17% 机器人学 2.42% 25 2021 全球人工智能领域评价分析报告 三、国别个案分析 本中心选取中国、美国、印度、韩国做深入案例分析,将其在 AI 领域的发文数据依据 WOS 类目进行统计,从而挖掘出 AI 领域的主 要研究方向、学科属性、机构分布状况及研究热点。 3.1 中国 中国人工智能领域发文 283,617 篇,排名前二十的 WOS 类目(简 称: TOP20 WoS)分布情况如图 12 所示。其中,偏基础理论的方向 为:“计算机科学,人工智能”(16.93%)和“计算机科学,理论和 方法”(9.51%),分布并不太高;偏应用研究的方向主要为:自动 化和控制系统(7.16%)、影像科学和照相技术(5.92%)、光学(3.96%)、 材料科学(3.94%)、遥感(3.92%)、设备和仪器(3.88%)等,大 体而言,中国人工智能在计算机视觉和医学领域的应用研究布局较多。 2 图 12 中国人工智能领域发文的 TOP20 WoS 类目分布(2016-2021 年) 由于期刊和 WoS 类目是一对多的关系,即一篇文章如果属于多个 WoS 类目,会被重复计数,即所有百 分比相加会大于 1。 26 2 2021 全球人工智能领域评价分析报告 中国人工智能领域发文 TOP20 机构分布数据显示(表 8),除了 排名第 1 的中国科学院,其余都是高校科研机构,其中排名前五的是 中国科学院、清华大学、中国科学院大学、上海交通大学和浙江大学。 在 TOP100 发文机构中,除高校科研机构外,仅有一家鹏城实验室占 据一席之地,发文 1,021 篇,总被引 6,663 次,发文排名第 82。 中国人工智能领域发文中,被引次数最多的是计算机视觉领域关 于 ResNet 的论文《Deep Residual Learning for Image Recognition》, 由微软研究院的何恺明等四人发文,目前被引次数达 19,203 次。单篇 被引次数第二的是关于全新的卷积神经网络框架 DenseNet 的论文 《Densely Connected Convolutional Networks》,同时被 CVPR 评为 2017 年最佳论文,由清华大学 2013 级本科生刘壮(发文时就读于“姚 班”3,现就职于 Facebook AI 研究院)与康奈尔大学及 Facebook AI 研 究院的相关学者合作发文,目前被引次数 9,141 次。被引次数第三的 来自中科院的胡杰(同属于 Momenta 自动驾驶公司)、吴恩华、Sun, Gang(同属于 Momenta 自动驾驶公司) 和牛津大学的 Shen, Li、Albanie, Samuel 合作的关于全新图像识别结构的论文《Squeeze-and-Excitation Networks》,被引次数 4,643 次。单篇被引次数第四的来自香港中文 大学与微软亚洲研究院何恺明合作的关于三层卷积网络来实现图像 超分辨率的论文《Image Super-Resolution Using Deep Convolutional Networks》,被引次数 3,221 次。单篇被引次数第五的来自中山大学 与上百家机构合作的发文,被引次数 2,049 次。单篇被引次数第六的 来自中科院、哈尔滨工业大学、香港理工大学和西安交通大学合作的 关于一个用于图像去噪的前馈去噪卷积神经网络(DnCNN)的论文 《 Beyond a Gaussian Denoiser: Residual Learning of Deep CNN for Image Denoising》,被引次数 1,900 次。 姚班:清华大学“姚班”即“清华大学计算机科学实验班”,由姚期智先生主导,创办于 2005 年。为 了更好地培养计算机学科的拔尖创新性人才,姚先生于 2009 年 4 月将"软件科学实验班"更名为"计算机科学 实验班",这个班也被清华师生亲切地称为"姚班"。 27 3 2021 全球人工智能领域评价分析报告 表 8 中国人工智能领域发文总量 TOP20 机构 发文排名 机构 总发文量 总引文量 单篇最高被引次数 1 Chinese Acad Sci 19842 218007 4542 2 Tsinghua Univ 9599 125016 9141 3 Univ Chinese Acad Sci 9455 89103 4542 4 Shanghai Jiao Tong Univ 8111 70209 1027 5 Zhejiang Univ 7876 72553 402 6 Beihang Univ 6019 53735 609 7 Harbin Inst Technol 5818 61148 1900 8 Wuhan Univ 5557 59652 970 9 Huazhong Univ Sci & Technol 5493 65257 621 5439 56410 783 10 Univ Elect Sci & Technol China 11 Xi An Jiao Tong Univ 5209 56531 1900 12 Northwestern Polytech Univ 5076 54804 864 13 Peking Univ 5020 55281 709 14 Southeast Univ 4955 45718 484 15 Xidian Univ 4854 45422 368 16 Sun Yat Sen Univ 4845 53391 2049 17 Beijing Inst Technol 4828 43036 875 18 Tianjin Univ 4671 47276 576 19 Univ Sci & Technol China 4168 42150 980 3948 27543 1068 20 Beijing Univ Posts Telecommun & 综合而言,中国人工智能领域发文 TOP100 机构分布(图 13), 北京市占 18 家,江苏省 13 家,上海市和广东省各 9 家,湖北省 6 家, 山东省、陕西省和中国香港各 5 家,安徽省、湖南省、湖南省、辽宁 省、四川省和浙江省各 3 家。 28 2021 全球人工智能领域评价分析报告 图 13 中国人工智能领域发文 TOP100 机构地域分布(2016-2021 年) 29 2021 全球人工智能领域评价分析报告 3.2 美国 美国人工智能领域发文 207,826 篇, 排名前二十的 WoS 类目分 布情况如图 14 所示,其中偏基础理论的方向为:“计算机科学,人 工智能”(13.36%)、“计算机科学,理论和方法”(8.36%)、“统 计学和概率”(3.17%),整体比中国占比高;同时偏应用研究的方 向为:放射学、核医学和医学成像(4.23%)、自动化和控制系统 (3.93%)、影像科学和照相技术(3.80%)、生物医学工程(3.50%)、 多学科材料科学(2.96%)和数学和计算生物学(2.24%)等,分布较 广泛,在医学、生物医学工程的应用研究布局较多。 图 14 美国人工智能领域发文的 TOP20 WoS 类目分布(2016-2021 年) 美国人工智能领域发文 TOP20 机构分布情况显示(表 9),排名 前 20 的都是高校科研机构,其中排名前五的是斯坦福大学、MIT、 密歇根大学、伊利诺伊大学和华盛顿大学。在 TOP100 发文机构中, 也仅有一家企业:微软研究院,发文 1,186 篇,总被引 50,854 次,发 文排名第 65。这种情况与中国类似。 在美国人工智能领域发文中,被引次数最高的论文是 2017 年卷 积 神 经 网 络 的 经 典 之 作 《 ImageNet Classification with Deep Convolutional Neural Networks》,由谷歌公司 Krizhevsky, Alex 及被 称为“神经网络之父”、“人工智能教父”的 Hinton, Geoffrey E.和 OpenAI 公司的 Sutskever, Ilya 合著,至今被引 14,730 次。单篇被引次数第二 30 2021 全球人工智能领域评价分析报告 的是关于一个全新的卷积神经网络框架 DenseNet 的论文《Densely Connected Convolutional Networks》,同时被 CVPR 评为 2017 年最佳 论文,由康奈尔大学、清华大学 2013 级本科生刘壮(发文时就读于 “姚班”4,现就职于 Facebook AI 研究院)与康奈尔大学及 Facebook AI 研究院的相关学者合作发文,目前被引次数达 9,141 次。单篇被引 次数第三的是关于一个目标检测算法 YOLO 的论文《You Only Look Once: Unified, Real-Time Object Detection》,由华盛顿大学、艾伦人 工智能研究所、Facebook 研究院合作发文,目前被引次数达 7,002 次。 单 篇 被 引 次 数 第 四 的 来 自 谷 歌 大 脑 Abadi, Martin 等 人 的 论 文 《TensorFlow: A system for large-scale machine learning》,提出了 TensorFlow 的机器学习系统,目前被引次数达 6,981 次。单篇被引次 数第五的来自北卡罗来纳大学、Zoox 公司(Amazon 旗下的自动驾驶 汽车公司)、谷歌和密歇根大学合作的关于目标检测算法 SSD 的论 文《SSD: Single Shot MultiBox Detector》,目前被引次数达 6,916 次。 表 9 美国人工智能领域发文总量 TOP20 机构 发文排名 机构 总发文量 总引文量 单篇最高被引次数 1 Stanford Univ 5635 118017 3908 2 MIT 4919 88313 2221 3 Univ Michigan 4917 71032 6916 4 Univ Illinois 4824 62078 1364 5 Univ Washington 3970 73040 7002 6 Univ Calif Berkeley 3933 85441 4028 7 Carnegie Mellon Univ 3795 58719 1820 8 Harvard Univ 3747 58986 2297 9 Georgia Inst Technol 3699 50021 1440 10 Johns Hopkins Univ 3694 55982 4783 11 Univ Calif Los Angeles 3414 47535 2674 12 Univ Penn 3337 53372 5698 13 Columbia Univ 3309 52223 2107 14 Purdue Univ 3235 32054 581 15 Univ Maryland 3224 44830 923 16 Texas A&M Univ 3209 31240 1416 17 Univ Calif San Diego 3164 51595 2301 18 Univ Southern Calif 2987 33411 693 19 Univ Wisconsin 2931 38350 1804 20 Univ Texas Austin 2909 36248 2297 31 2021 全球人工智能领域评价分析报告 3.3 印度 印度人工智能领域发文 61,554 篇,排名前二十的 WoS 类目分布 情况如图 15 所示。其中偏基础理论的方向:“计算机科学,人工智能” (20.46%)和“计算机科学,理论和方法(17.36%)”,占比较高,体 现印度在 AI 基础理论研究方面的关注度较高;偏应用研究的方向为: 材料科学(4.74%)、自动化和控制系统(4.25%)、多学科工程(4.11%)、 影像科学和照相技术(3.27%)、能源和燃料(3.21%)、生物医学工 程(2.81%),分布较广泛,体现印度在材料和自动化控制领域的应 用研究布局较多。 图 15 印度人工智能领域发文的 TOP20 WoS 类目分布(2016-2021 年) 印度人工智能领域发文的 TOP20 发文机构分布情况(表 10)显 示,除了第 19 名的印度科学与工业研究理事会(CSIR),其余都是 高校科研机构,其中排名前五的印度理工学院、印度国立理工学院、 加尔各答大学、印度安那大学和印度科技学院的发文均在 1000 篇以 上。在发文 100 篇以上机构中,只有一家企业塔塔咨询服务公司(Tata Consultancy Serv)发文 151 篇,总被引 526 次,发文排名第 95。 印度人工智能领域发文中,被引次数最多的一篇是关于用深度学 习算法自动检测视网膜眼底照片中的糖尿病性视网膜病变和糖尿病 32 2021 全球人工智能领域评价分析报告 性黄斑水肿的论文,由印度亚拉文眼科医院、印度金奈 Sankara Nethralaya 眼科医院与谷歌研究院、德克萨斯大学奥斯汀分校、伯克 利 大 学 、 哈 佛 医 学 院 等 多 家 机 构 的 合 作 发 文 《 Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs》,目前被引次数达 2,297 次。 单篇被引次数第二的来自印度天文与天体物理学研究中心与上百家 机构合作的发文,被引次数 2,049 次;单篇被引次数第三的来自 Jawaharlal Inst Postgrad Med Educ & Res 的发文,被引次数 1,139 次。 表 10 印度人工智能领域发文总量 TOP20 机构 发文排名 机构 总发文量 总引文量 单篇最高被引次数 1 Indian Inst Technol 3372 26322 461 2 Natl Inst Technol 2461 17152 221 3 Jadavpur Univ 1132 7136 376 4 Anna Univ 1076 5790 173 5 Indian Inst Sci 1050 7605 373 6 Vellore Inst Technol 938 5306 115 7 Indian Inst Technol Delhi 752 5770 206 8 VIT Univ 704 7574 204 9 Indian Inst Technol Kharagpur 691 4434 229 10 Indian Inst Technol Madras 680 3814 937 11 Indian Stat Inst 653 4746 189 12 Delhi Technol Univ 605 3505 154 13 Indian Inst Technol Roorkee 570 4346 96 14 Amity Univ 562 2024 95 15 Amrita Vishwa Vidyapeetham 526 1736 229 16 Indian Inst Technol Guwahati 523 3041 77 17 SRM Inst Sci & Technol 490 1415 53 18 Thapar Inst Engn & Technol 440 2735 83 19 CSIR 409 3659 169 20 Indian Inst Technol Kanpur 377 2152 264 33 2021 全球人工智能领域评价分析报告 3.4 韩国 韩国人工智能领域发文 32,520 篇,排名前二十的 WoS 类目分布 情况如图 16 所示。其中偏基础理论的方向为:“计算机科学,理论和 方法”(14.83%)、“计算机科学,人工智能(10.97%)”;偏应用研究 的方向为:材料科学(7.40%)、应用物理学(6.84%)、设备和仪器 (5.00%)、多学科化学(4.64%)、多学科工程(4.54%)、自动化 和控制系统(3.73%)、影像科学和照相技术(3.70%)、分析化学 (3.57%),分布较广泛,较集中在材料、物理、设备和仪器、化学 等方面。 图 16 韩国人工智能领域发文的 TOP20 WoS 类目分布(2016-2021 年) 表 11 是韩国人工智能领域发文的 TOP20 发文机构分布情况,除 了第 2 名韩国科学技术研究院和第 20 名三星电子,其余都是高校科 研机构,其中,排名前八的首尔国立大学、延世大学、韩国大学、成 均馆大学、汉阳大学、世宗大学和庆熙大学都发文在 1000 篇以上。 在企业发文方面,三星电子是唯一发文在 100 篇以上的企业,发 文 465 篇,总被引 4,513 次,发文排名第 20。其次,NAVER 集团(类 似中国的百度)和 LG 电子发文各 89 篇;现代汽车公司发文 52 篇; 韩国最大移动通讯运营商 SK Telecom 发文 53 篇。医疗 AI 企业 Lunit 34 2021 全球人工智能领域评价分析报告 公司发文 30 篇。比较上述中、美、印度三国,韩国是唯一有企业跻 身 TOP20 发文的国家,且有五家企业进入 TOP100,充分体现了韩国 AI 研究重视应用与产品转化的能力。 韩国人工智能领域发文中,被引次数最多的一篇是关于简单高效 的前向卷积神经网络注意力模块的论文《CBAM: Convolutional Block Attention Module》,由韩国科学技术研究院、Lunit 公司和美国 Adobe 公司研究院合作发文,目前被引次数达 1,888 次。单篇被引次数第二 的来自首尔国立大学发文,被引次数 1,435 次;单篇被引次数第三的 来自韩国大学和北卡罗来纳大学的合作发文,被引次数 1,277 次;单 篇被引次数第四的来自三星电子和德克萨斯大学奥斯汀分校、西班牙 维戈大学、纽约大学、威斯康星大学的合作发文,被引次数 1,133 次; 单篇被引次数第五的来自延世大学和英国卢瑟福.阿普尔顿国家实验 室、英国巴斯大学、牛津大学、北卡罗来纳大学教堂山分校和伦敦帝 国理工学院的合作发文,被引次数 1,004 次。 表 11 韩国人工智能领域发文总量 TOP20 机构 发文排名 机构 总发文量 总引文量 单篇最高被引次数 1 Seoul Natl Univ 3538 33466 1435 2 Korea Adv Inst Sci & Technol 2443 25633 1888 3 Yonsei Univ 2397 21202 1004 4 Korea Univ 2313 26763 1277 5 Sungkyunkwan Univ 1492 11674 366 6 Hanyang Univ 1432 11318 471 7 Sejong Univ 1258 18268 531 8 Kyung Hee Univ 1116 11632 434 9 Univ Ulsan 914 9048 440 10 Kyungpook Natl Univ 877 6235 202 11 Pusan Natl Univ 872 6957 461 12 Chung Ang Univ 804 4734 390 13 Inha Univ 686 4213 195 14 Ajou Univ 563 4850 161 15 Yeungnam Univ 537 4816 165 16 Gachon Univ 498 3189 195 17 Chonnam Natl Univ 494 4433 440 18 Univ Sci & Technol 487 2965 115 19 Dongguk Univ 478 3503 91 20 Samsung Elect 465 4513 1133 35 2021 全球人工智能领域评价分析报告 为比较国家间人工智能研究的侧重点,本中心整理了四个国家在 人工智能领域发文排名前二十的 WoS 类目比较表(表 12)。从表中 可见,美国与印度对于 AI 基础理论研究的关注较为明显,而中国、 韩国在应用领域的投入较多。其中,中国在计算机视觉和医学领域的 应用研究布局较多,美国在医学、生物医学工程的应用研究布局较多, 韩国的企业研究与产品转化值得关注。 在排名前二十的 WoS 类目中,美国涉及而中国未涉及4的领域为: 基础理论的统计学和概率、数学和计算生物学,应用研究的放射学、 核医学和医学成像、生物医学工程、神经科学和机器人学。相反地, 中国涉及的领域而美国未涉及的领域为:应用研究的遥感、设备和仪 器、应用物理学、能源和燃料、机械工程和多学科地球科学。 印度在基础理论上的研究投入高于其他三国,且在材料和自动化 控制领域的应用研究布局较多。而韩国更偏向于在材料、物理、设备 和仪器、化学的应用研究布局。 4 注:这里的“未涉及”只是在 TOP20 WoS 类目中未涉及,并不表示在所有 WoS 类目中不涉及。 36 2021 全球人工智能领域评价分析报告 表 12 四国人工智能领域 TOP20 WoS 类目占比比较 中国 序 号 美国 占比 占比 WoS 类别 (% WoS 类别 电气和电 子工程 30.55 计算机科 2 3 学,人工 电气和电子 (% 工程 18.67 计算机科 16.93 学,人工智 WoS 类别 电气和电子 工程 13.36 学,人工智 能 计算机科 计算机科 计算机科 系统 学,理论和 28.29 计算机科 能 14.20 (% 8.36 方法 学,理论和 20.46 17.36 电信 11.33 学,信息系 8.05 电信 13.22 统 计算机科 5 学,理论 计算机科 9.51 和方法 6 自动化和 控制系统 和照相技 7.16 5.92 5.17 4.59 工程 10 11 12 13 光学 多学科工 程 多学科材 料科学 遥感 电信 5.01 医学和医学 4.23 成像 计算机科 学,软件 12.55 统 放射学、核 科应用 9 学,信息系 学,跨学科 7.67 应用 计算机科 学,跨学 5.59 计算机科 术 8 计算机科 应用 影像科学 7 学,跨学科 3.96 自动化和控 制系统 影像科学和 照相技术 生物医学工 程 学,软件工 3.93 3.92 统计学和概 率 多学科材料 科学 计算机科学, 信息系统 电信 28.98 14.83 12.78 多学科材料 科学 计算机科学, 人工智能 多学科材料 科学 计算机科学, 理论和方法 10.97 7.40 7.03 4.74 应用物理学 6.84 学,软件工 4.72 设备和仪器 5.00 4.25 多学科化学 4.64 4.11 多学科工程 4.54 程 3.80 3.50 自动化和控 制系统 多学科工程 计算机科 3.49 程 3.94 工程 (%) 计算机科 计算机科 3.95 电气和电子 占比 方法 计算机科 4 WoS 类别 ) 智能 学,信息 韩国 占比 ) ) 1 印度 学,硬件和 3.34 体系结构 3.17 2.96 影像科学和 照相技术 能源和燃料 37 3.27 3.21 计算机科学, 跨学科应用 自动化和控 制系统 影像科学和 照相技术 4.45 3.73 3.70 2021 全球人工智能领域评价分析报告 中国 序 号 美国 占比 占比 WoS 类别 (% WoS 类别 15 16 设备和仪 器 环境科学 应用物理 学 光学 2.90 3.41 多学科科学 2.88 3.25 神经科学 计算机科 17 学,硬件 和体系结 19 20 能源和燃 料 机械工程 多学科地 球科学 WoS 类别 (% 3.04 学,硬件和 生物医学工 2.92 2.62 环境科学 数学和计算 生物学 机器人学 占比 (%) 2.81 分析化学 3.57 环境科学 2.63 环境科学 3.41 2.70 多学科科学 2.30 多学科科学 3.34 2.68 应用物理学 2.28 2.37 机械工程 2.28 程 体系结构 2.94 WoS 类别 ) 计算机科 构 18 (% 3.88 韩国 占比 ) ) 14 印度 计算机科学, 软件工程 机械工程 3.24 3.10 放射学、核医 2.24 设备和仪器 2.23 学和医学成 2.98 像 2.15 光学 38 1.83 能源和燃料 2.55 2021 全球人工智能领域评价分析报告 四、机构和学者分析 4.1 科研机构分布 从 AI 数据集中初步拆分出全球机构 204,712 个,发文总量 TOP100 的研究机构国家分布情况见表 13,其中中国(38 家研究机 构)和美国(27 家研究机构)以绝对的优势名列第一和第二名,其次 澳大利亚、加拿大和英国各入围 5 家科研机构,并列第三,韩国和中 国香港各 3 家科研机构入围,并列第四。 表 13 全球人工智能领域发文总量 TOP100 研究机构的国家分布情况 国家/地区 发文 TOP100 科研机构数 中国 38 美国 27 澳大利亚 5 加拿大 5 英国 5 韩国 3 中国香港 3 新加坡 2 伊朗 2 印度 2 巴西 1 比利时 1 德国 1 俄罗斯 1 法国 1 荷兰 1 日本 1 瑞士 1 引文总量 TOP100 的研究机构国别分布如表 14 所示,美国在文 献引用影响力上更为突出,36 家科研机构入围,排名第一,中国有 27 家研究机构入围,排名第二,其次是澳大利亚和英国,有 6 家科研机 构入围,排名第三,加拿大有 5 家研究机构入围,瑞士和中国香港各 3 家入围。 39 2021 全球人工智能领域评价分析报告 表 14 全球人工智能领域引文总量 TOP10 研究机构的国家分布情况 国家/地区 被引 TOP100 科研机构数 美国 36 中国 27 澳大利亚 6 英国 6 加拿大 5 瑞士 3 中国香港 3 德国 2 新加坡 2 伊朗 2 巴西 1 比利时 1 丹麦 1 法国 1 韩国 1 荷兰 1 日本 1 苏格兰 1 4.2 企业分布 上述初步拆分的两万多个机构中,企业机构发文占比并不多。从 发文前 2200 多个机构中,筛选出发文总量和引文总量的 TOP50 家企 业。国家分布情况如表 15 和表 16 所示(跨国企业以总部地址判断国 家分布),由两表可见,无论是按发文还是被引排名,美国以微软、 谷歌、IBM、Facebook 和 Adobe 为代表的企业遥遥领先,排名第一, 发文 TOP50 中有 23 家入榜,在引文上表现更佳,有 31 家入榜;中 国以阿里巴巴、华为、微软亚洲和腾讯为代表的 11 家企业排名第二。 在中国企业中,阿里巴巴、华为、微软亚洲、腾讯、腾讯 AI 实验室、 百度、百度研究所、商汤科技研究所都在发文和被引 TOP50 企业榜 中。此外中国电子科技集团有限公司、华为诺亚方舟实验室和国家电 网有限公司也入榜发文 TOP50 企业,Momenta 自动驾驶公司、商汤 科技集团有限公司和旷视科技入榜被引 TOP50 企业。 40 2021 全球人工智能领域评价分析报告 表 15 全球人工智能领域发文总量 TOP50 企业的国家分布情况 国家/地区 发文 TOP50 企业数 美国 23 中国 11 日本 5 德国 4 英国 2 法国 1 韩国 1 荷兰 1 意大利 1 印度 1 表 16 全球人工智能领域引文总量 TOP50 企业的国家分布情况 国家/地区 被引 TOP50 企业数 美国 31 中国 11 英国 3 韩国 2 德国 1 荷兰 1 日本 1 4.3 学者分布 从 AI 数据集初步拆分出 280 余万名学者(未合并清洗),其中, 发文总量 TOP100 的学者国家分布情况见表 17,中国学者入围 45 人, 遥遥领先,美国入围 14 人,排名第二。 表 17 全球人工智能领域发文总量 TOP100 学者的国家分布情况 国家/地区 发文 TOP100 学者数 中国 45 美国 14 澳大利亚 7 新加坡 6 加拿大 5 中国香港 3 西班牙 2 新西兰 2 英国 2 阿联酋 1 埃及 1 41 2021 全球人工智能领域评价分析报告 国家/地区 发文 TOP100 学者数 冰岛 1 丹麦 1 德国 1 格鲁吉亚 1 韩国 1 卡塔尔 1 瑞士 1 沙特阿拉伯 1 希腊 1 意大利 1 印度 1 中国澳门 1 从引文总量分布来看(表 18) ,美国在文献引用影响力上更突出, 被引 TOP100 的学者中,美国有 35 名学者入围,排名第一;中国有 21 名学者入围,排名第二;英国有 10 名学者入围,排名第三。 表 18 全球人工智能领域引文总量 TOP100 学者的国家分布情况 国家/地区 被引 TOP100 学者数 美国 35 中国 21 英国 10 荷兰 8 新加坡 6 中国香港 5 澳大利亚 5 德国 2 瑞士 2 伊朗 2 韩国 1 加拿大 1 西班牙 1 中国澳门 1 通过机构和学者层面的数据分析可以看出,中国在科研机构和学 者数量上遥遥领先,而企业布局明显落后于美国。如果考虑引文量等 质量指标,美国在科研机构、企业和学者分布上都以绝对的优势稳居 全球第一,这是需要引起我们重视和着力赶超的。 42