或许是改变下一个三十年的发布会:2023.11.7-OpenAI开发者大会总结

目录原贴更新下载字体：小中大背景：原标记

2023-11-09 12:00#1 标记1

本文为1580字，建议阅读4分钟，
2023.11.7-OpenAI开发者大会总结
官方新闻：https://openai.com/blog/new-models-and-developer-products-announced-at-devday
或许这是一个改变下一个30年的发布会，一个表格总结

更新项	简介	竞品/开源替代品‍
GPTs	创建自定义ChatGPT，并分享给其他人使用。由Assistants API实现。自定义的内容包括： · 预置提示词（prompt） · 预置文档和数据（Retrieval） · 使用代码解释器（Code Interpreter） · 使用函数调用（Function calling）。可以实现带知识库的自定义角色、指定领域的工作流。后续会有GPTs商店。	FlowGPT等
Assistants API	实现GPTs的API，支持 · 读取文档和数据（Retrieval） · 使用代码解释器（Code Interpreter） · 使用函数调用（Function calling） · 对话线程（Thread）无限长度且永久保存，方便回溯对话进行追问。能实现多个代理（Agent）之间协作，是真正智能体的前奏。	AutoGPT、BabyAGI等； GPTs如果是5分，AutoGPT、BabyAGI是1分；
All-Tools	无需手动切换能力，ChatGPT自动调用代码解释器、联网、Dalla·E 3等能力，这实际也是一个自动代理。	无
GPT-4 Turbo API	· 更快，大概快3倍 · 更便宜，输入降2/3，输出降1/2 · 知识库更新到23年4月 · 上下文从8K提升至128K（大约300页文档） · Function calling：支持一次调用多个函数，提高了准确性 · 更遵循指令要求，新增JSON mode，严格返回JSON格式 · 新增seed参数，与AI绘画类型，可以保持输出内容不变，适用于调试。 · 返回log probabilities：每个最可能生成的token的对数概率 · GPT-3.5 Turbo 同时也有升级 · 视觉能力，目前拆成了单独的API，后续会合并	Claude 2 有100K 上下文，能力比不了。其他的 LLM 差距更大。
DALL·E 3 API	生成图片	代理 Midjourney 的Discord频道，可以实现API效果，不稳定； Stable Diffusion 可以自己搭建API，或者使用Stability AI 的API；
TTS API	文字生成语音，支持中文，支持多语言混合文本，带有仿真的换气声，效果很真实。	效果最好的是微软TTS，另外还有Fliki（支持中文）、11Labs（中文效果一般）等
定制模型	GPT-4 微调目前还在实验阶段，积极使用GPT-3.5微调的开发者会收到邀请；定制 GPT-4 ，很难很贵，仅对部分企业开放；	自研模型或基于 LLaMa 2等模型微调，效果没法比
Whisper v3	开源的语音转文字模型，更新v3版本，支持多语言混合语音；后续会推出API；	微软语音转文本性价比高，另外也有科大讯飞等国内服务可用
Consistency Decoder	适用于Stable Diffusion的解码器，可以改善人脸、线条、文本的生成效果，但是会让生成速度慢不少。

⭐星标AI寒武纪，好内容不错过⭐
用你的赞和在看告诉我～

觉得好看，请点“在看”👇👇

相关