MusicGen-简单可控的音乐生成模型

2年前发布 386 0 0

MusicGen 是一个由Meta发布的开源 AI 音乐生成模型,可以根据文本输入生成新的音乐片段,MusicGen 是一个由Meta发布的开源 AI 音乐生成模型,可以根据文本输入生成新的音乐片段

收录时间:
2024-09-11
MusicGen-简单可控的音乐生成模型MusicGen-简单可控的音乐生成模型

MusicGen-简单可控的音乐生成模型

MusicGen是什么?

MusicGen 是一个由Meta发布的开源 AI 音乐生成模型,可以根据你输入的描述文本生成新的音乐,也可以上传现有的音乐旋律作为参考。

MusicGen基于 Transformer 架构,可以高效处理音频和文本数据。测试表明,MusicGen 的性能可与 Google 的 MusicLM 媲美。

MusicGen可以做什么?

  1. 文本提示音乐生成:MusicGen 可以根据文本提示生成新的音乐片段,这些提示可以选择性地与现有的旋律对齐。
  2. 高质量样本生成:通过使用高效的令牌交错模式和单阶段方法,MusicGen 可以生成高质量的音乐样本,无需复杂的级联模型。

如何使用MusicGen?

MusicGen在线体验地址:https://huggingface.co/spaces/facebook/MusicGen

使用步骤如下:

  1. 打开:https://huggingface.co/spaces/facebook/MusicGen
  2. 如下图所示,输入文本描述,即你想生产的音乐描述;
  3. 上传参考的音乐旋律,这是个可选项,也可以不上传;
  4. 点击下方的生成【Generate】按钮,等待几十秒即可生成音乐;
  5. 点击播放最右边生成的音乐,即可播放和下载。

MusicGen-简单可控的音乐生成模型

另外,在操作下方,也提供了一些参考demo,点击即可体验。

相关资源链接

数据统计

相关导航

SmolLM-HuggingFace发布的高性能小型语言模型

SmolLM-HuggingFace发布的高性能小型语言模型

SmolLM是由 Huggingface 最新发布的一组高性能的小型语言模型,参数分别为 1.35 亿、3.6 亿和 17 亿,训练数据来自高质量数据集 SmolLM-Corpus,其中包括 Cosmopedia v2、Python-Edu 和 FineWeb-Edu。SmolLM 模型在多种基准测试中表现不错, 适合跑在手机这种终端设备上。,SmolLM是由 Huggingface 最新发布的一组高性能的小型语言模型,参数分别为 1.35 亿、3.6 亿和 17 亿,训练数据来自高质量数据集 SmolLM-Corpus,其中包括 Cosm…
Open-Sora: Colossal-AI开源的类Sora架构视频生成模型

Open-Sora: Colossal-AI开源的类Sora架构视频生成模型

Open-Sora是一个开源Sora复现方案,旨在帮助用户构建类似于OpenAI Sora的视频生成模型。它提供了一个完整的开发流程,包括数据处理、模型训练和部署,支持动态分辨率和多种模型结构。,Open-Sora是一个开源Sora复现方案,旨在帮助用户构建类似于OpenAI Sora的视频生成模型。它提供了一个完整的开发流程,包括数据处理、模型训练和部署,支持动态分辨率和多种模型结构。