热门

DeepFloyd IF

1年前发布 231 0 0

DeepFloyd IF是由StabilityAI旗下的DeepFloyd研究团队推出的开源的文本到图像生成模型，IF是一个基于级联方法的模块化神经网络。

收录时间：

2025-04-22

打开网站手机查看

AI训练模型 # AI训练模型

DeepFloyd IF

DeepFloyd IF

DeepFloyd IF是由StabilityAI旗下的DeepFloyd研究团队推出的开源的文本到图像生成模型，IF是一个基于级联方法的模块化神经网络。

IF是由多个神经模块（处理特定任务的独立神经网络）构建的，在一个架构内联合起来产生协同效应。
IF以级联方式生成高分辨率图像：从产生低分辨率样本的基础模型开始，然后由一系列的升级模型提升，以创造令人惊叹的高分辨率图像。
IF的基础和超分辨率模型采用扩散模型，利用马尔可夫链步骤将随机噪声引入数据中，然后再反转过程，从噪声中生成新的数据样本。
IF在像素空间内操作，而不是依赖潜伏图像表征的潜伏扩散（如稳定扩散）。

数据统计

相关导航

MiracleVision奇想智能

MiracleVision奇想智能是由美图秀秀公司推出的自研AI视觉大模型，不仅具备高度的美学导向和图像处理能力，还能够广泛地应用于多个行业，提高工作流效率。

DeepSpeed

微软开源的低成本实现类似Cha...

Grok-1.5V：xAI发布的多模态AI大模型

Grok-1.5V不仅具备强大的文本处理能力，还可以处理各种视觉信息，如文档、图表、截图和照片。这使得Grok-1.5V能够在多学科推理、理解科学图表、阅读文本和实现真实世界的空间理解等领域与现有的前沿多模态模型竞争。,Grok-1.5V不仅具备强大的文本处理能力，还可以处理各种视觉信息，如文档、图表、截图和照片。这使得Grok-1.5V能够在多学科推理、理解科学图表、阅读文本和实现真实世界的空间理解等领域与现有的前…

Ollama

Ollama是一个用于在本地计算机上运行大型语言模型的命令行工具，允许用户下载并本地运行像Llama 2、Code Llama和其他模型，并支持自定义和创建自己的模型。该免费开源的项目，目前支持macOS和Linux操作系统，未来还将支持Windows系统。

Scale AI

更好的数据会带来更好的性能...

Lamini

Lamini是一个LLM引擎，可以让不仅仅是机器学习专家的任何开发人员，都能在大型数据集中，把高性能的LLM训练得像ChatGPT一样好。

Replicate

在线运行开源机器学习模型

Imagen

Google AI文字到图像生成模型