
Audiobox-Meta推出的新一代音频生成模型
Audiobox是Meta发布的一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示,Audiobox可以轻松生成各种声音,包括语音、音效和音景,从而为多种用例提供定制音频。,Audiobox是Meta发布的一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示,Audiobox可以轻松生成各种声音,包括语音、音效和音景,从而为多种用例提供定制音频。
Octopus v2是由斯坦福大学研究团队最近推出的可在设备上运行的端侧AI模型,引起了开发者社区的广泛关注,一夜之间下载量超过了2000次。Octopus v2是一个拥有20亿参数的模型,能够在智能手机、汽车、个人电脑等设备上运行。它在准确性和延迟方面超越了GPT-4,且将上下文长度减少了95%。与基于RAG的Llama7B模型相比,Octopus v2的速度快了36倍。
Octopus v2的论文和模型已提供下载。
论文地址:https://arxiv.org/abs/2404.01744
模型主页:https://huggingface.co/NexaAIDev/Octopus-v2
Octopus v2的推出标志着设备端AI智能体时代的到来,为开发者和用户提供了前所未有的AI应用体验和可能性。