你可能无法想象：OpenAI开发超级人工智能取得重大突破，比GPT4厉害几个数量级

2023-11-23 22:02#1 标记1

本文为1744字，建议阅读4分钟‍
这两天随着对OpenAI人事大地震持续深挖，据知情人爆料：‍
OpenAI资深高管 Mira Murati 在周三对员工表示，一封关于 AI 突破性进展 Q*（读作 Q-Star）的信件促使董事会采取了非常激进的行动，把sam赶出了公司
那么究竟什么是 Q*？‍

Q*（Q-Star）突破‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍
得益于强大的计算资源，这个新模型能解决一些数学问题……虽然目前只能解决小学生级别的数学问题，但这样的成绩让研究人员对 Q* 的未来充满期待。
你可能觉得：
> 能解决小学数学问题
> 那又怎样，有什么大不了的？
> 研究人员为什么要寄这封信？
因为 OpenAI 已经有了一个堆栈，可以根据计算和数据预测智能。他们在发布 GPT4 时就披露了这一点。
Q* 是一个相对较小的模型，它能利用推理可靠、稳定地解决小学数学问题。这是一个算法上的突破。
他们有缩放图来预测数据和计算带来的智能提升，因此他们知道自己很可能可以解决精英人类和超越人类的问题。
OpenAI还没有 AGI。
但他们有一个近期路线图。现在的问题是要不要走这条路。 sam对此的反应是筹集数百亿美元：
> 让人们手中尽快拥有这项技术
> 并在各地建立数据中心，以尽快部署这项技术。
OpenAI 的新技术 Q*（Q-star）融合了两个关键元素：
Q 学习（一种强化学习算法）和 A Star（一种搜索算法）
1. Q 学习非常关键，它是第一个被广泛认可的强化学习算法，至今仍被广泛应用。在这里，Token 或词汇被视为状态，而某些回应则被视为行动。
2. A Star 是一种以其在搜索过程中保存结果于内存而著称的图搜索算法。这意味着在新的 RLHF 训练中需要存储大量数据。搜索对于训练中的多轮优化至关重要。基本上，我认为是将 A* 公式应用于 Q 值，以实现多轮推理。
为什么这种方法可能非常有效但又难以实现呢？
> 多轮优化意味着需要更多的模型前向传递和梯度计算
> 解决复杂数学问题需要这种方法
> 实际上，这可能更接近于 RLAIF

更多Q*（Q-Star）信息爆料和猜测
据多个信源信息：
> Q*可能具备自主学习和自我改进的能力。
> Q*模型可进行自主决策，可能已具备轻微自我意识。
> GPT-Zero项目解决了数据问题，自己”生产“数据。
> OpenAI可能正在利用计算机合成数据进行训练。
据Reddit用户爆料和猜测：
Q*可能是一种非常先进的具有“可怕数学能力”的模型，已经具备自主学习和自我改进的能力。该模型能够通过评估其行为的长期后果，在广泛的场景中做出复杂的决策。 Q*可能与强化学习中的Q-learning算法有关，这是一种评估在特定情境下采取特定行动的好坏的方法。还提到了Q-Value和Bellman方程，这些都是强化学习中的重要概念，用于指导AI在不同情境下做出最优决策。
简而言之，Q*似乎是一个高级的人工智能模型，能够在多种情境中学习和做出最优决策，具有自主学习和自我改进的能力。
Reddit原帖：https://www.reddit.com/r/OpenAI/comments/181n8am/what_is_q/?rdt=36999
而根据@theinformation的信息
OpenAI的首席科学家 Ilya Sutskever 领衔的一个名叫 GPT-Zero 的项目实现了巨大突破。他们克服了训练数据限制的困难，可以自己合成训练数据。据悉，Ilya Sutskever的 GPT-Zero 的项目，帮助 OpenAI 克服了在获取足够高质量数据来训练新模型方面的限制。

此前Ilya在一次采访中说到： “Without going into details I'll just say the Data Limit can be overcome..." “无需详细说明，我只是说数据限制是可以克服的......” GPT-Zero项目研究的主要使用计算机生成的数据来训练模型，而不是从互联网上提取的真实世界数据，
因为OpenAI已经获得了互联网上能获得的几乎所有的真实文本数据，已经无法再获得足够的数据来进行下一阶段训练。
OpenAI 研究团队利用GPT-Zero这一创新成果，构建了能解决基础数学问题的模型，这一直是现有 AI 模型的难题，无法进行复杂的推理能力。两位顶尖研究人员 Jakub Pachocki 和 Szymon Sidor 运用 Ilya Sutskever 的研究成果，开发出了这个名为 Q*（Q-Star）的模型。
Theinformation报道：https://www.theinformation.com/articles/openai-made-an-ai-breakthrough-before-altman-firing-stoking-excitement-and-concern
而本月sam在接受金融时报采访的时候曾表达：开发 AGI 的最大挑战之一是使这些系统能够进行基本的理解和创新。他比喻说，就像牛顿发明微积分一样，AI 模型也需要能够超越现有知识，创造新的知识的能力。
种种迹象表明Q*（Q-Star）的模型确实是超越了GPT 4非常多的模型，可以说是直接跨越了几代，具有自主学习和自我改进的能力，甚至就像之前Ilya表达的可能已经表现出了轻微的自我意识能力。

结语
‍‍
以上内容是我综合网上各种信源爆料，当事人采访，还有自己的推测总结，不一定准确，请注意分辨
⭐星标AI寒武纪，好内容不错过⭐
用你的赞和在看告诉我～

GPT5见分晓？👇👇