谷歌 I/O开发者大会汇总:AI模型全面更新 几乎覆盖所有生成模型类型

谷歌 I/O开发者大会汇总:AI模型全面更新 几乎覆盖所有生成模型类型

    正在检查是否收录...

在昨晚的Google I/O发布会上,Google宣布了一系列AI模型的更新,涵盖了从文本到视觉和音乐的多个领域:

Gemini1.5Pro:支持200万上下文,针对翻译、编码、推理等关键用例进行了质量改进,但未发布测试结果。

Gemini Flash:针对响应速度至关重要的窄或高频任务进行了优化,价格比GPT-3.5更便宜。

Gemini模型家族:

Ultra:最大的模型,仅在Gemini Advanced提供。

Pro:最佳总体性能模型,API预览版中提供。

Flash:轻量级速度/效率模型,API预览版中提供。

Nano:设备上模型,将内置于Chrome126中。

Gemini Gems:谷歌的GPTs,支持自定义与Gemini的互动方式。

Gemini Live:基于声音的深入双向对话能力,Project Astra实时视频理解个人助理聊天机器人即基于此。

Gemma2:6月发布,规模为27B,以更小的尺寸提供接近Llama-3-70B的性能。

PaliGemma:谷歌的第一个视觉语言开放模型,灵感来自PaLI-3。

Veo:DeepMind开发的模型,旨在对标Sora,但一些体验者认为效果不尽人意。

Imagen3:图像模型,能够理解自然书写的提示,生成高质量逼真图像,并在渲染文本方面表现优异。

Music AI Sandbox:旨在改变音乐创作方式的AI工具,用户可以全新创作乐器部分,轻松转换不同曲目风格。

Trillium:谷歌最新的TPUs,计算性能比上一代TPU v5e提升高达4.7倍。

这次发布会展示了Google在AI领域的全面布局和创新能力,从文本到视觉再到音乐,Google的AI模型正在不断进步,为用户带来更加丰富和高效的体验。

geminigoogleemmatpugptapiai模型逼真图像视觉语言chrome图像模型轻量级llama上下文ai工具gpts个人助理自定义gpt-3高质量
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-13929.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

为什么腾讯认为DiT架构是未来的主流?做了哪些改进?

上一篇

HPE Aruba Networking的前瞻视角:构建AI赋能的安全融合网络

下一篇
  • 复制图片
按住ctrl可打开默认菜单