英伟达:2024年将是机器人全面崛起反击人类的一年



本文为694字,建议阅读2分钟‍
现任英伟达高级研究科学家兼人工智能代理负责人,OpenAI曾经的第一位实习生jim fan 认为2024年将是机器人全面崛起的第一年,以下是详细观点:
被问及2024年除了LLMs之外最大的事情是什么,毫无疑问的回答是机器人。距离ChatGPT具备物理人工智能代理的时刻仅有约3年。长期以来,我们一直受到莫拉维克悖论(英语:Moravec's paradox)的困扰,这是一种反直觉的现象,即“人类认为容易的任务对人工智能来说非常困难,反之亦然”。在这种背景下,机器人技术的迅猛发展成为2024年的焦点之一
2024年将被铭记为人工智能社区大力反击这一诅咒的第一年。虽然我们不会立即获胜,但我们将走上取得胜利的道路。
在2023年,我们已经看到了未来机器人基础模型和平台的雏形:
多模式LLMs,以机械臂作为物理输入/输出设备:VIMA,PerAct,RvT(NVIDIA),RT-1,RT-2,PaLM-E(Google),RoboCat(DeepMind),Octo(伯克利,斯坦福,CMU)等。

机器人联结System 1负责无意识的感觉运动控制(LLMs)和System 2负责高级推理:Eureka(NVIDIA),Code as Policies(Google)等取得巨大进步。

2023年机器人在强大硬件方面取得了惊人的进展:特斯拉Optimus@elonmusk
,Figure
@adcock_brett,1X@ericjang11
,Apptronik,Sanctuary,Agility+Amazon,Unitree等。

数据一直是机器人的软肋。学术界正在共同努力策划下一个ImageNet(人工智能深度学习取得突破的关键项目),比如Open X-Embodiment(RT-X)数据集。虽然尚不够多样,但这是迈向正确方向的一大步。


模拟和合成数据将在解决机器人灵巧性甚至整体计算机视觉问题上发挥关键作用。

‍(1)NVIDIA Isaac可以以比实时快1000倍的速度模拟现实。传入的数据流随着计算规模的增加而扩展。

(2)通过硬件加速的光线追踪可以实现逼真的效果。逼真的渲染还带有免费的地面真实注释,如分割、深度、3D姿势等。

‍(3)模拟器甚至可以将真实世界的数据扩大,创造更大的数据集,从而大大减少昂贵的人工演示工作。MimicGen(NVIDIA)是一个典型的例子
⭐星标AI寒武纪,好内容不错过⭐
用你的赞和在看告诉我~

机器人觉醒?👇👇
到顶部