谷歌 I/O 2024大会简报:谷歌强势回归,可惜被OpenAI抢了头条



谷歌发布了一系列新产品,包括集成了AI的新产品、全新的语言模型以及许多不属于大型语言模型(LLM)的新功能
以下是我觉得特别有意思的一些亮点:
语言方面

优点:
推出新的Gemini 1.5 Flash!成本仅为GPT-4o的7%(专业版成本的1/10)
Gemma 2:更多开源AI模型!
PaliGemma:新的视觉语言模型
Gemini Nano:设备端运行
Gemini 1.5 pro 上下文扩展到了惊人的2M token‍‍

缺点:
没有提供基准测试数据?
视觉方面
优点:
Imagen 3:创建更加逼真的图像‍‍
Music Audio Studio:与油管合作‍‍
推出视频生成模型Veo(对标OpenAI Sora):1分钟1080p,waitlist地址:https://aitestkitchen.withgoogle.com/zh/tools/video-fx

缺点:
还是没有提供基准测试数据?

助理和代理方面
优点:
推出Project Astra项目,类似OpenAI的GPT4o的语音视觉人机交互方式,聚焦未来的AI助理,演示令人惊叹,可以在智能眼镜上运行,出色的视觉语言技能,非常酷的应用。可惜OpenAI抢先一步发了😂😂,上不了头条

缺点:
语音实时交互看起来比GPT-4o慢?不确定……
硬件方面

优点:
发布TPUv6 ,计算性能提高4.7倍,2024年底推出
液体冷却能力超过1千兆瓦(不确定其重要性)
B100将于2025年初推出
缺点:
谷歌似乎总是在GPU部署上出问题……
产品方面
优点:
AI深度整合到现有产品中(搜索、Gmail、照片、工作空间)
我非常喜欢生成搜索,尤其是在旅行规划方面
照片搜索看起来看起来很有意思,可以搜索照片中的信息‍‍‍‍‍‍
缺点:
不明确这些功能的费用是多少?
总结
优点:
谷歌重新调整方向,稳步前进。发布了许多令人兴奋的技术公告,并进行了深度产品整合。我对谷歌非常看好——他们有足够的计算能力和产品界面来收集数据‍
缺点:
对开发者的关注不多,注册过程仍然比较令人难受‍‍‍‍‍‍
OpenAI抢在谷歌I/O大会之前发布更新,这让谷歌I/O大会显得黯淡无光。
OpenAI在基准测试中似乎仍占优势,而谷歌没有推出具有更好数据的新模型让我有些失望‍
⭐星标AI寒武纪,好内容不错过⭐
用你的赞和在看告诉我~

谷歌还能上头条吗👇👇
到顶部