Stability AI发布音频模型 Stable Audio2.0:支持生成多种类型音乐时长达3分钟

关注+2024-04-04作者：学臣

4月4日消息:著名开源大模型平台 Stability.ai 在官网正式发布了音频模型 Stable Audio2.0。这一版本支持用户通过文本或音频生成多种类型的高质量音乐，时长可达3分钟44.1kHz。

相较于之前的版本，Stable Audio2.0采用了 Diffusion transformer（DiT）替换了 U-Net 架构，使得生成音乐的效率大幅提升。此外，该模型使用了超过80万个音频文件组成的数据集，总计超过1.95万小时的音频，与知名音乐服务商 AudioSparx 合作，生成的音乐可用于商业化。

用户在体验 Stable Audio2.0时，可以通过输入提示词来生成不同类型的音乐，例如冥想背景音乐或体育赛事激情音乐等。生成的音乐可以在网站上在线试听，也可选择下载使用。

对于视频自媒体用户来说，Stable Audio2.0免费赠送20积分，并支持商业化使用，为他们的创作提供了更多可能性。随着 Stability.ai 不断推出新功能和技术，用户可以期待更多高质量、多样化的音乐生成体验。

Stability AI发布音频模型 Stable Audio2.0:支持生成多种类型音乐 时长达3分钟

Stability AI发布音频模型 Stable Audio2.0:支持生成多种类型音乐时长达3分钟