Stability AI发布音频模型 Stable Audio2.0:支持生成多种类型音乐 时长达3分钟

Stability AI发布音频模型 Stable Audio2.0:支持生成多种类型音乐 时长达3分钟

    正在检查是否收录...

著名开源大模型平台 Stability.ai 在官网正式发布了音频模型 Stable Audio2.0。这一版本支持用户通过文本或音频生成多种类型的高质量音乐,时长可达3分钟44.1kHz。

相较于之前的版本,Stable Audio2.0采用了 Diffusion transformer(DiT)替换了 U-Net 架构,使得生成音乐的效率大幅提升。此外,该模型使用了超过80万个音频文件组成的数据集,总计超过1.95万小时的音频,与知名音乐服务商 AudioSparx 合作,生成的音乐可用于商业化。

用户在体验 Stable Audio2.0时,可以通过输入提示词来生成不同类型的音乐,例如冥想背景音乐或体育赛事激情音乐等。生成的音乐可以在网站上在线试听,也可选择下载使用。

对于视频自媒体用户来说,Stable Audio2.0免费赠送20积分,并支持商业化使用,为他们的创作提供了更多可能性。随着 Stability.ai 不断推出新功能和技术,用户可以期待更多高质量、多样化的音乐生成体验。

体验地址:https://stableaudio.com/generate

商业化高质量大模型数据集音乐生成transformer音频生成ios背景音乐提示词diffusion开源大模型音频模型体育赛事自媒体多样化
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-12486.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

OceanPen Art AI绘画系统 运营教程(二)AI视频AI创作PPT

上一篇

华人开源最强「AI 程序员」炸场,让 GPT-4 自己修 Bug!

下一篇
  • 复制图片
按住ctrl可打开默认菜单