牛！Top10的大模型核心团队！

2024-04-22 10:04#1 标记1

大家好，我是花哥。
人工智能（AI）大模型正在全球范围内重塑世界，各大科技大厂和初创企业都在积极布局。OpenAI因何能打造出顶级模型ChatGPT和Sora？
事实上，除了优质的数据、充足的算力和高效的算法，顶尖技术人才储备，也是 OpenAI 能够在大模型领域做到始终遥遥领先的资本。
未来，通用人工智能（AGI）和超级智能（Super Intelligence）的实现也离不开大模型人才。因此，全面了解全球大模型发展现状和人才分布对AI领域的研究者、从业者和决策者至关重要。
为此，AMiner 发布了《全球十个大模型核心团队成员分析报告》，旨在为大模型领域的相关人员在今后的研究交流、人才引进提供参考。文末附完整报告～

该报告分析了全球十大模型（GPT、Gemini、Claude、GLM、LLaMA、Qwen、Falcon、PaLM、BERT、T5）的核心成员，涉及地域、年龄、教育、华人占比和学术影响力。主要结论如下：
核心成员年轻化，69%在40岁以下。尽管H-Index较低，但有成员具高影响力，H-Index达103，86人获“AI 2000全球人工智能学者”称号。
华人在大模型领域具竞争力，国外团队中华人占18.7%。
核心成员多来自世界著名高校，如加州大学、斯坦福大学，清华大学也占重要地位。
139位曾在中国高校就读的核心成员中，86位进入国际市场，表明中国高校教育得到国际认可。
在此本文为大家具体分析下全球十个大模型核心团队的的地域、年龄、教育背景、华人占比和学术影响力等方面，揭示全球大模型人才的一些趋势和特点，
十个大模型核心成员数量：
最多来自Google的Gemini和OpenAI的GPT团队
本报告基于AMiner平台，挑选了全球十大模型：GPT、Gemini、Claude、GLM、LLaMA、Qwen、Falcon、PaLM、BERT、T5，并对其团队进行分析。报告选取2023年前（含2023年）的22篇技术论文和报告，若模型无技术报告或未列出作者，则选择所属机构的代表性技术论文。核心成员共计968位，最多来自Google的Gemini和OpenAI的GPT团队，分别有417人和262人。

图｜十个大模型基本信息
数据来源：AMiner开放平台
（注：因存在核心成员同时参与多个模型开发创立，故核心团队人数加总>968）
核心成员年龄分布：
中国注重培养新锐力量，青年成员（小于 40 岁）占比高达 84%
全球十个大模型核心成员年龄分布特征明显。在中国，40岁及以下成员占比高达84%，远高于美国的67%和全球的69%。中国学者在此年龄段的TGI达到显著的122.9。数据表明，这十大模型团队中的986名核心成员整体呈年轻化趋势，中国团队更偏好青年成员，凸显了对新兴力量的重视。在41~55岁年龄段，美国占主导，占比32%，而中国为16%。大于55岁的核心成员中，美国有9人，而中国没有。总体来看，大模型的核心力量集中在年轻人（<=40岁），且中国在大模型领域更重视培养新兴力量。

图｜中、美、全球十个大模型核心成员年龄分布
数据来源：AMiner 开放平台（注：中、美成员按照当前所在机构国家统计）
TGI =（当前国家年龄段分布占比/全球成员分布占比）× 100
核心成员的教育经历：
TOP10 高校主要分布在美、英、中、印
全球十大模型的核心成员多来自著名高校，前十大高校输送了573位人才，占总人数的59.2%。美国加州大学系统和斯坦福大学最多，分别输送了11.7%和9.7%的人才。清华大学位列第七，输送了5%的人才。印度理工学院也贡献了2.2%的人才。其他如麻省理工学院和卡耐基梅隆大学也有贡献。总之，全球高校为人工智能领域输送了大量人才，为模型发展奠定了坚实学术基础。

图｜十个大模型核心成员教育经历 TOP10 高校
数据来源：AMiner 开放平台（注：按核心成员就读院校及地区统计）

图｜中美两国大模型核心成员 TOP10 高校
数据来源：AMiner 开放平台（注：按核心成员就读院校及地区统计）
华人影响力不容忽视：
国外大模型团队核心成员华人占比 18.7%
报告数据显示，在挑选的十大模型团队的968名成员中，899位来自国外大模型（如GPT、Gemini等）团队，其中华人成员占18.7%，即167位。这表明华人在大模型国际市场中具有竞争力。此外，国际一流科技公司的全球影响力和知名度为华人提供了更多选择。
最高学历曾在中国高校就读的核心成员：
86 位进入国际市场
报告显示，挑选的模型团队中，139位华人核心成员曾在中国高校接受教育，其中86位（62%）已流入国际市场。这表明，国际市场对中国高校教育的高度认可。未来，中国科技产业的蓬勃发展和高校教育的提升有望吸引更多优秀华人回国或留在国内，推动中国的科技创新发展。

图｜核心成员中国教育背景人员国外就业动向
数据来源：AMiner 开放平台（注：流入机构为核心成员最近机构所在地区统计）
核心成员学术影响力：
成员主要集中在 H-index35 以内
数据显示，十个大模型的核心成员中，804位（占83.1%）的H-index值在1-35之间，显示出他们在学术领域的影响力较小。这可能是因为核心成员更注重技术研发和工程实践，而非学术出版和交流。另外，团队中年轻成员较多，而H-index需要时间的积累，因此年轻的核心成员在该指标上表现普遍较低。

图｜中、美、全球十个大模型核心成员 H-Index 分布
数据来源：AMiner 开放平台（注：中、美成员按照当前所在机构国家统计）
十个大模型团队中不乏学术贡献卓越的学者，其中有 86 人被评为“AI 2000 全球人工智能学者。下表列举了 H-index 前 15 名核心成员，最高 H-index 达 100，对学术领域做出不可忽视的贡献。

图｜十个大模型核心成员 H-Index Top15
数据来源：AMiner 开放平台（注：按照当前所在机构国家统计，部分呈现）
另外的，AMiner团队在《全球十个大模型核心团队成员分析报告》中，针对巅峰团队GPT和Gemini，从人才结构、学术背景、稳定性和学术贡献方面进行了深入分析。
完整版报告（阅读原文可跳转）：
https://open.aminer.cn/open/article?id=6620fea7d9a27592a9337fd5