
Imagen 3-谷歌推出的文生图模型,可生成高质量图像
Imagen 3 是 DeepMind 开发的最新文本到图像模型,它能够生成高质量、高分辨率的图像,具有更好的细节和丰富的光照效果。该模型支持多种视觉风格,从照片般逼真到油画质感,以及黏土动画场景。,Imagen 3 是 DeepMind 开发的最新文本到图像模型,它能够生成高质量、高分辨率的图像
通义万相是阿里云推出的一款AI绘画创作大模型,它是阿里云「通义大模型家族」的新成员。该模型将大模型的模态从文本和语音延伸到图像,逐步向多模态模型靠近。 官网链接:https://wanxiang.aliyun.com/
通义万相拥有文生图和图生图能力,具体包括以下三种功能:
通义万相基于阿里研发的组合式生成模型Composer,这是一种基于扩散模型的「组合式生成」框架。其基本原理是:先将图像拆解成不同设计元素(配色、草图、布局、风格、语义、材质等),再使用AI模型将这些元素重新组合,中间使用的元素可以自由编辑。这种「组合爆炸」可以给人类设计师生成图片提供极大的自由度和想象空间。
通义万相可应用于艺术设计、游戏和文创等应用场景,大幅降低图片设计门槛。
目前需要申请体验资格,直接在官网即可提交申请。 官网链接:https://wanxiang.aliyun.com/