吴恩达手把手教你驾驭GPT-4o与Gemini Pro：干货满满

2024-06-12 11:48#1 标记1

吴恩达老师就不用多介绍了，随着GPT-4o与Gemini Pro发布，吴老师第一时间跟进，建议大家应采用新的方式和最佳实践,以充分利用这些先进模型的优势
一个好消息：本周末吴老师将开源自己的某些工作流和提示工程，比如翻译提示工程‍‍‍‍
你是否有过这样的经历: 大模型总是无法完全理解您的复杂要求?新一代大型语言模型或许能为您提供更智能、更高效的解决方案‍
我们来看看吴恩达老师的手把手调教建议
要点‍‍‍‍
利用增强的推理能力‍‍‍‍‍
像GPT-4o、Claude 3等先进模型,展现了强大的逻辑推理能力，能够精准解读富含细节的复杂指令。开发人员应该写出详细的“超级提示”（mega-prompt：长达1-2页)来精确指导模型完成任务,而不是简单的1-2句查询
利用更大输入窗口‍‍‍‍‍
从GPT-3引领的少量示例学习（few-shot learning）到如今百万级令牌的输入窗口，如GPT-4o接受12.8万个、Claude 3 Opus接受20万个，以及Gemini Pro 1.5扩展到2百万量级，开发者可以提供数十乃至数百个示例，实现多示例学习（many-shot learning），极大提升模型的泛化和理解能力，而不仅限于传统的少量"几例学习"。
优化的工作流程‍‍‍‍‍‍‍‍
面对复杂应用构建，一种迭代式策略应被广泛采纳：先用简单提示测试模型表现，根据输出不足之处逐步丰富提示内容，形成详尽的超级提示。若仍不满足需求，则考虑增加示例数量或微调模型。最后，若问题依旧，通过细分任务并采用代理工作流程（agentic workflow）来解决
深入探索提示策略‍‍‍‍‍‍‍‍
对于那些希望深入了解如何高效引导AI的开发者，《Medprompt》论文提供了复杂的提示策略框架，可以实现更优结果
paper：https://arxiv.org/pdf/2311.16452

全文‍‍‍‍‍‍‍‍‍‍‍‍‍

近日，谷歌宣布Gemini Pro 1.5的输入上下文窗口将从100万扩展至200万标记，同时OpenAI发布了GPT-4o，其生成标记的速度比GPT-4 Turbo快2倍，成本降低了50%，并原生支持和生成多模态标记。我认为这些发展是过去18个月趋势的最新体现。鉴于我们所见到的改进，开发者的最佳实践也随之发生了变化‍
自2022年11月ChatGPT推出以来，随着GPT-4、Gemini 1.5 Pro、Claude 3 Opus和Llama 3-70B等重要里程碑的发布，许多模型提供商在两个重要方面改进了他们的能力：（一）推理，使得大型语言模型能够思考复杂的概念并遵循复杂的指令；（二）更长的输入上下文窗口‍
GPT-4等先进模型的推理能力使它们非常擅长解释带有详细说明的复杂提示。许多人习惯于向大型语言模型发送一两个句子的快速查询。相比之下，在构建应用程序时，我经常看到精细的团队写下可能是1到2页长的提示（我的团队称之为“超级提示”），详细说明了我们希望大型语言模型执行任务的方式。我仍然看到一些团队在撰写详细说明方面做得不够。要了解中等长度提示的示例，请查看Claude 3的系统提示。它详细说明了Claude应该如何表现‍
这是与我们通常使用LLMs的Web用户界面时非常不同的提示方式，我们可能会迅速发送一个查询，如果回复不尽人意，通过与聊天机器人反复对话来澄清我们想要的内容‍
此外，输入上下文窗口长度的增加为开发者的工具箱增添了另一项技术。GPT-3开启了很多关于少样本上下文学习的研究。例如，如果您正在使用LLM进行文本分类，您可能会给出一些（比如1到5个）文本片段及其类别标签，以便它可以利用这些示例对其他文本进行泛化。然而，随着输入上下文窗口的延长——GPT-4o接受128,000个输入标记，Claude 3 Opus接受200,000个标记，而Gemini 1.5 Pro接受100万个标记（刚刚宣布的200万个标记是一个有限预览）——LLMs不再受到少量示例的限制。通过多样本学习，开发者可以在提示中提供几十甚至几百个示例，这比少样本学习更有效‍
在构建复杂工作流程时，我看到开发者通过以下过程取得了良好的结果：
编写快速、简单的提示，并查看其表现如何。
根据输出的不足之处，逐步完善提示。这通常会导致一个更长、更详细的提示，甚至可能是一个超级提示。
如果仍然不够，考虑使用少样本或多样本学习（如果适用）或者，较少情况下，微调。
如果仍然不能得到所需的结果，将任务分解为子任务，并应用代理工作流程。
‍
我希望这样的流程能够帮助您更轻松地构建应用程序。如果您有兴趣深入了解提示策略，我建议阅读《Medprompt》论文，该论文提出了一套复杂的提示策略，可以带来非常好的结果。
继续学习！
Andrew
⭐星标AI寒武纪，好内容不错过⭐
用你的赞和在看告诉我～

LLM实践👇👇