DALL·E 3 DALL·E 3是OpenAI的文本到图像合成模型的最新版本,旨在使用文本描述生成图像,相比此前的版本,DALL·E 3进一步降低了提示词门槛,提高语义理解和细节优化。原生构建在ChatGPT上,可供所有ChatGPT Plus和企业用户使用,并在2023年秋季通过API和Labs提供。
Monkey:华中科技大学开源的多模态大模型 Monkey 是华中科技大学与金山软件联合推出的一种高性能多模态大模型,通过提高输入分辨率和引入多级描述生成方法,解决了现有模型在复杂场景和视觉细节处理方面的挑战。Monkey 可以基于现有视觉编辑器进行构建,无需从0预训练,大大提高了研发效率。,Monkey 是华中科技大学与金山软件联合推出的一种高性能多模态大模型,通过提高输入分辨率和引入多级描述生成方法,解决了现有模型在复杂场景和视觉细节处理方面的挑战。Monkey 可以基于现有视觉编辑器…
Gradio Gradio是一个开源的Python库,用于构建演示机器学习或数据科学,以及web应用程序。用户可以使用Gradio基于自己的机器学习模型或数据科学工作流快速创建一个漂亮的用户界面,让用户可以尝试拖放他们自己的图像、粘贴文本、录制他们自己的声音,并通过浏览器与您的演示程序进行交互。
Segment Anything:首个图像分割基础模型 SAM是一种来自 Meta AI 的新 AI 模型,只需单击一下即可“切出”任何图像中的任何对象,SAM是一种来自 Meta AI 的新 AI 模型,只需单击一下即可“切出”任何图像中的任何对象
SAM 2-Meta推出的图像和视频对象分割模型 SAM 2(Segment Anything Model 2)是由Meta推出的新一代AI分割模型,能够在图像和视频中实现高度精确、实时的对象分割。它在不需要定制适配的情况下,能够对任何未曾见过的对象进行分割,适用于各种视觉领域。这一模型在原有的Segment Anything Model (SAM)基础上进行了扩展和改进,支持更广泛的应用场景。,SAM 2(Segment Anything Model 2)是由Meta推出的新一代AI分割模型,能够在图像和视频中实现高度精确、实时的对象分割。它在不需要定制适配的情况下,能够对任何未曾见过的对象…