Riffusion Riffusion 是一个免费开源的具有稳定扩散的实时音乐和音频生成库,用户只需输入音乐描述,AI便可以生成对应风格的音乐。该开源项目由Seth Forsgren 和 Hayk Martiros推出,Riffusion的背后原理是基于Stable Diffusion(文本生成图像模型)微调频谱图,
悦音配音 悦音配音是制片帮旗下推出的一款AI智能在线配音语音合成工具,可以帮助用户在线将文字输入快速轻松转换成语音。该AI配音工具提供男声、女声、童声、普通话、方言、英文等多种真人声音,在你输入文字后便可以直接智能生成音频。
Deepgram Deepgram是一个提供先进的AI语音识别和自然语言处理技术的平台,核心产品是强大的语音到文本(Speech-to-Text)和文本到语音(Text-to-Speech)API,让开发者能够快速将语音转录和理解功能集成到他们自己的应用程序和服务中。
Audiobox Audiobox是Meta于2023年11月30日推出的免费开源的AI语音和声音生成模型,12月11日上线在线网页版本,用户可免费体验该模型的能力。Audiobox是Meta最新一代的音频生成模型,可以结合使用语音输入和自然语言文本提示来生成语音和音效,从而可以轻松地为各种用例创建逼真的自定义音频。