谷歌 I/O 2024大会简报：谷歌强势回归，可惜被OpenAI抢了头条

2024-05-14 21:17#1 标记1

谷歌发布了一系列新产品，包括集成了AI的新产品、全新的语言模型以及许多不属于大型语言模型（LLM）的新功能
以下是我觉得特别有意思的一些亮点：
语言方面

优点：
推出新的Gemini 1.5 Flash！成本仅为GPT-4o的7%（专业版成本的1/10）
Gemma 2：更多开源AI模型！
PaliGemma：新的视觉语言模型
Gemini Nano：设备端运行
Gemini 1.5 pro 上下文扩展到了惊人的2M token‍‍

缺点：
没有提供基准测试数据？
视觉方面
优点：
Imagen 3：创建更加逼真的图像‍‍
Music Audio Studio:与油管合作‍‍
推出视频生成模型Veo（对标OpenAI Sora）：1分钟1080p，waitlist地址：https://aitestkitchen.withgoogle.com/zh/tools/video-fx

缺点：
还是没有提供基准测试数据？
‍
助理和代理方面
优点：
推出Project Astra项目，类似OpenAI的GPT4o的语音视觉人机交互方式，聚焦未来的AI助理，演示令人惊叹，可以在智能眼镜上运行，出色的视觉语言技能，非常酷的应用。可惜OpenAI抢先一步发了😂😂，上不了头条

缺点：
语音实时交互看起来比GPT-4o慢？不确定……
硬件方面

优点：
发布TPUv6 ，计算性能提高4.7倍，2024年底推出
液体冷却能力超过1千兆瓦（不确定其重要性）
B100将于2025年初推出
缺点：
谷歌似乎总是在GPU部署上出问题……
产品方面
优点：
AI深度整合到现有产品中（搜索、Gmail、照片、工作空间）
我非常喜欢生成搜索，尤其是在旅行规划方面
照片搜索看起来看起来很有意思，可以搜索照片中的信息‍‍‍‍‍‍
缺点：
不明确这些功能的费用是多少？
总结
优点：
谷歌重新调整方向，稳步前进。发布了许多令人兴奋的技术公告，并进行了深度产品整合。我对谷歌非常看好——他们有足够的计算能力和产品界面来收集数据‍
缺点：
对开发者的关注不多，注册过程仍然比较令人难受‍‍‍‍‍‍
OpenAI抢在谷歌I/O大会之前发布更新，这让谷歌I/O大会显得黯淡无光。
OpenAI在基准测试中似乎仍占优势，而谷歌没有推出具有更好数据的新模型让我有些失望‍
⭐星标AI寒武纪，好内容不错过⭐
用你的赞和在看告诉我～

谷歌还能上头条吗👇👇