通义听悟 通义听悟是阿里巴巴推出的智能AI会议转录和总结工具,支持实时双语翻译字幕,一键高亮要点,智能提炼总结,高效记录、整理和共享音视频内容。多种字幕形态随心切换,自动区分发言人,总结关键词、议程、摘要、待办事项和问题。支持一键导出和公开分享。
Deepgram Deepgram是一个提供先进的AI语音识别和自然语言处理技术的平台,核心产品是强大的语音到文本(Speech-to-Text)和文本到语音(Text-to-Speech)API,让开发者能够快速将语音转录和理解功能集成到他们自己的应用程序和服务中。
Riffusion Riffusion 是一个免费开源的具有稳定扩散的实时音乐和音频生成库,用户只需输入音乐描述,AI便可以生成对应风格的音乐。该开源项目由Seth Forsgren 和 Hayk Martiros推出,Riffusion的背后原理是基于Stable Diffusion(文本生成图像模型)微调频谱图,