或许是改变下一个三十年的发布会:2023.11.7-OpenAI开发者大会总结



本文为1580字,建议阅读4分钟,
2023.11.7-OpenAI开发者大会总结
官方新闻:https://openai.com/blog/new-models-and-developer-products-announced-at-devday
或许这是一个改变下一个30年的发布会,一个表格总结
更新项 简介 竞品/开源替代品
GPTs 创建自定义ChatGPT,并分享给其他人使用。由Assistants API实现。自定义的内容包括: · 预置提示词(prompt) · 预置文档和数据(Retrieval) · 使用代码解释器(Code Interpreter) · 使用函数调用(Function calling)。 可以实现带知识库的自定义角色、指定领域的工作流。后续会有GPTs商店。 FlowGPT等
Assistants API 实现GPTs的API,支持 · 读取文档和数据(Retrieval) · 使用代码解释器(Code Interpreter) · 使用函数调用(Function calling) · 对话线程(Thread)无限长度且永久保存,方便回溯对话进行追问。 能实现多个代理(Agent)之间协作,是真正智能体的前奏。 AutoGPT、BabyAGI等; GPTs如果是5分,AutoGPT、BabyAGI是1分;
All-Tools 无需手动切换能力,ChatGPT自动调用代码解释器、联网、Dalla·E 3等能力,这实际也是一个自动代理。

GPT-4 

Turbo API

· 更快,大概快3倍 · 更便宜,输入降2/3,输出降1/2 · 知识库更新到23年4月 · 上下文从8K提升至128K(大约300页文档) · Function calling:支持一次调用多个函数,提高了准确性 · 更遵循指令要求,新增JSON mode,严格返回JSON格式 · 新增seed参数,与AI绘画类型,可以保持输出内容不变,适用于调试。 · 返回log probabilities:每个最可能生成的token的对数概率 · GPT-3.5 Turbo 同时也有升级 · 视觉能力,目前拆成了单独的API,后续会合并 Claude 2 有100K 上下文,能力比不了。其他的 LLM 差距更大。

DALL·E 3 

API

生成图片

代理 Midjourney 的Discord频道,可以实现API效果,不稳定;

Stable Diffusion 可以自己搭建API,或者使用Stability AI 的API;

TTS API 文字生成语音,支持中文,支持多语言混合文本,带有仿真的换气声,效果很真实。 效果最好的是微软TTS,另外还有Fliki(支持中文)、11Labs(中文效果一般)等
定制模型 GPT-4 微调目前还在实验阶段,积极使用GPT-3.5微调的开发者会收到邀请; 定制 GPT-4 ,很难很贵,仅对部分企业开放; 自研模型或基于 LLaMa 2等模型微调,效果没法比
Whisper v3 开源的语音转文字模型,更新v3版本,支持多语言混合语音; 后续会推出API; 微软语音转文本性价比高,另外也有科大讯飞等国内服务可用

Consistency 

Decoder

适用于Stable 

Diffusion的解码器,可以改善人脸、线条、文本的生成效果,但是会让生成速度慢不少。



⭐星标AI寒武纪,好内容不错过⭐
用你的赞和在看告诉我~

觉得好看,请点“在看”👇👇
到顶部