Audiobox Audiobox是Meta于2023年11月30日推出的免费开源的AI语音和声音生成模型,12月11日上线在线网页版本,用户可免费体验该模型的能力。Audiobox是Meta最新一代的音频生成模型,可以结合使用语音输入和自然语言文本提示来生成语音和音效,从而可以轻松地为各种用例创建逼真的自定义音频。
Riffusion Riffusion 是一个免费开源的具有稳定扩散的实时音乐和音频生成库,用户只需输入音乐描述,AI便可以生成对应风格的音乐。该开源项目由Seth Forsgren 和 Hayk Martiros推出,Riffusion的背后原理是基于Stable Diffusion(文本生成图像模型)微调频谱图,
ElevenLabs ElevenLabs 是国外一个火爆的AI文字转语音平台,目前已完成测试阶段并推出了正式版。借助先进的多语言人工智能技术,ElevenLabs 可以自动识别包括中文在内的28种语言,并将其转换为逼真的语音。免费版提供每月10000个字符的转换和创建3个自定义声音。