(相关资料图)
美国东部时间8月2日,Meta公司开源了一款名为AudioCraft的生成式AI工具,该工具能够帮助用户通过文本提示创作音乐和音频。 据Meta公司介绍,AudioCraft主要包含三个核心组件。首先是MusicGen,它使用Meta公司拥有或特别授权的音乐进行训练,根据文本提示生成音乐。其次是AudioGen,它使用公共音效进行训练生成音频或扩展现有音频,未来还可以生成环境音效,如狗叫、汽车鸣笛、木地板上的脚步声等。最后是改进版的EnCodec,这是一个基于神经网络的音频压缩解码器,能够生成更高质量的音乐并减少人工痕迹,或对音频文件进行无损压缩。 开源后的AudioCraft工具,相关研究人员和从业人员可以使用自己的数据集训练模型。Meta公司宣称,AudioCraft系列模型能够长期稳定地生成高质量音频,而且易于使用,能够为音乐家和声音设计师提供灵感,帮助他们快速集思广益,并以新的方式迭代他们的作品。 此外,今年6月份,Meta公司已经开源了AI语言模型MusicGen。该模型基于2017年谷歌推出的Transformer模型,主要用于音乐生成,能够将文本和已有的旋律转化为完整乐曲。
标签: