你可能无法想象:OpenAI开发超级人工智能取得重大突破,比GPT4厉害几个数量级



本文为1744字,建议阅读4分钟‍
这两天随着对OpenAI人事大地震持续深挖,据知情人爆料:‍
OpenAI资深高管 Mira Murati 在周三对员工表示,一封关于 AI 突破性进展 Q*(读作 Q-Star)的信件促使董事会采取了非常激进的行动,把sam赶出了公司
那么究竟什么是 Q*?‍

Q*(Q-Star)突破‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍
得益于强大的计算资源,这个新模型能解决一些数学问题……虽然目前只能解决小学生级别的数学问题,但这样的成绩让研究人员对 Q* 的未来充满期待。
你可能觉得: 
> 能解决小学数学问题 
> 那又怎样,有什么大不了的? 
> 研究人员为什么要寄这封信? 
因为 OpenAI 已经有了一个堆栈,可以根据计算和数据预测智能。他们在发布 GPT4 时就披露了这一点。 
Q* 是一个相对较小的模型,它能利用推理可靠、稳定地解决小学数学问题。这是一个算法上的突破。 
他们有缩放图来预测数据和计算带来的智能提升,因此他们知道自己很可能可以解决精英人类和超越人类的问题。 
OpenAI还没有 AGI。
但他们有一个近期路线图。现在的问题是要不要走这条路。 sam对此的反应是筹集数百亿美元: 
> 让人们手中尽快拥有这项技术 
> 并在各地建立数据中心,以尽快部署这项技术。
OpenAI 的新技术 Q*(Q-star)融合了两个关键元素:
Q 学习(一种强化学习算法)和 A Star(一种搜索算法)
1. Q 学习非常关键,它是第一个被广泛认可的强化学习算法,至今仍被广泛应用。在这里,Token 或词汇被视为状态,而某些回应则被视为行动。
2. A Star 是一种以其在搜索过程中保存结果于内存而著称的图搜索算法。这意味着在新的 RLHF 训练中需要存储大量数据。搜索对于训练中的多轮优化至关重要。基本上,我认为是将 A* 公式应用于 Q 值,以实现多轮推理。
为什么这种方法可能非常有效但又难以实现呢?
> 多轮优化意味着需要更多的模型前向传递和梯度计算
>  解决复杂数学问题需要这种方法
> 实际上,这可能更接近于 RLAIF

更多Q*(Q-Star)信息爆料和猜测
据多个信源信息:
> Q*可能具备自主学习和自我改进的能力。 
> Q*模型可进行自主决策,可能已具备轻微自我意识。
> GPT-Zero项目解决了数据问题,自己”生产“数据。 
> OpenAI可能正在利用计算机合成数据进行训练。 
据Reddit用户爆料和猜测:
Q*可能是一种非常先进的具有“可怕数学能力”的模型,已经具备自主学习和自我改进的能力。 该模型能够通过评估其行为的长期后果,在广泛的场景中做出复杂的决策。 Q*可能与强化学习中的Q-learning算法有关,这是一种评估在特定情境下采取特定行动的好坏的方法。还提到了Q-Value和Bellman方程,这些都是强化学习中的重要概念,用于指导AI在不同情境下做出最优决策。 
简而言之,Q*似乎是一个高级的人工智能模型,能够在多种情境中学习和做出最优决策,具有自主学习和自我改进的能力。 
Reddit原帖:https://www.reddit.com/r/OpenAI/comments/181n8am/what_is_q/?rdt=36999
而根据@theinformation的信息
OpenAI的首席科学家 Ilya Sutskever 领衔的一个名叫 GPT-Zero 的项目实现了巨大突破。他们克服了训练数据限制的困难,可以自己合成训练数据。 据悉,Ilya Sutskever的 GPT-Zero 的项目,帮助 OpenAI 克服了在获取足够高质量数据来训练新模型方面的限制。 

此前Ilya在一次采访中说到: “Without going into details I'll just say the Data Limit can be overcome..." “无需详细说明,我只是说数据限制是可以克服的......” GPT-Zero项目研究的主要使用计算机生成的数据来训练模型,而不是从互联网上提取的真实世界数据,
因为OpenAI已经获得了互联网上能获得的几乎所有的真实文本数据,已经无法再获得足够的数据来进行下一阶段训练。
OpenAI 研究团队利用GPT-Zero这一创新成果,构建了能解决基础数学问题的模型,这一直是现有 AI 模型的难题,无法进行复杂的推理能力。两位顶尖研究人员 Jakub Pachocki 和 Szymon Sidor 运用 Ilya Sutskever 的研究成果,开发出了这个名为 Q*(Q-Star)的模型。 
Theinformation报道:https://www.theinformation.com/articles/openai-made-an-ai-breakthrough-before-altman-firing-stoking-excitement-and-concern
而本月sam在接受金融时报采访的时候曾表达:开发 AGI 的最大挑战之一是使这些系统能够进行基本的理解和创新。 他比喻说,就像牛顿发明微积分一样,AI 模型也需要能够超越现有知识,创造新的知识的能力。 
种种迹象表明Q*(Q-Star)的模型确实是超越了GPT 4非常多的模型,可以说是直接跨越了几代,具有自主学习和自我改进的能力,甚至就像之前Ilya表达的可能已经表现出了轻微的自我意识能力。 

结语
‍‍
以上内容是我综合网上各种信源爆料,当事人采访,还有自己的推测总结,不一定准确,请注意分辨
⭐星标AI寒武纪,好内容不错过⭐
用你的赞和在看告诉我~

GPT5见分晓?👇👇
到顶部