360智脑-视觉大模型

2个月前更新 71 0 0

视觉大模型能看懂图片,未来看懂视频、听懂声音,视觉大模型能看懂图片,未来看懂视频、听懂声音

收录时间:
2024-09-11
360智脑-视觉大模型360智脑-视觉大模型

5 月 31 日消息,360 举办视觉大模型及 AI 硬件新品发布会,推出了 360 智脑・视觉大模型及多款 AI 硬件新品,并宣布 360 智慧生活正式进军 SMB 市场。

周鸿祎在发布会上表示,所有软件、App、网站,所有行业都值得用大模型进行重塑,而智能硬件是硬件化的 App。从大模型的发展趋势来看,多模态是大模型发展的必经之路,GPT-4 最重要的变化是拥有了多模态的处理能力。周鸿祎预言,多模态大模型与物联网的结合将会成为下一个风口。

360智脑-视觉大模型

360 在视觉感知能力基础上,融合千亿参数“360 智脑”大模型,基于十亿级互联网图文数据进行清洗训练,并针对安防场景百万级行业数据进行微调,最终打造出视觉及多模态大模型 ——360 智脑-视觉大模型。视觉大模型是“360 智脑”的重要能力组成,使其能看懂图片,未来看懂视频、听懂声音。

周鸿祎表示:“目前,大模型的能力主要体现在软件层,当大模型接入智能硬件,会让大模型的能力从数字世界走向物理世界。”

官网地址:https://ai.360.cn/

数据统计

相关导航

LaVie:上海人工智能实验室开源的视频生成模型

LaVie:上海人工智能实验室开源的视频生成模型

LaVie是一个高质量视频生成项目,使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频(T2V)生成框架,是视频生成系统Vchitect的主要部分。它还包括一个针对图像到视频(I2V)模型SEINE的微调版本。,LaVie是一个高质量视频生成项目,使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频(T2V)生成框架,是视频生成系统Vchitect的主要部…
CogVideoX-智谱推出的开源AI视频生成模型

CogVideoX-智谱推出的开源AI视频生成模型

CogVideoX是由智谱AI开发的视频生成大模型,具备强大的视频生成能力、只需输入文本或图片就可以轻松完成视频制作。此次开源的是CogVideoX-2B,20亿参数规格的模型,是CogVideoX 系列视频生成模型中的第一个模型,与智谱推出的AI视频生成产品清影同源。,CogVideoX是由智谱AI开发的视频生成大模型,具备强大的视频生成能力、只需输入文本或图片就可以轻松完成视频制作。此次开源的是CogVideoX-2B,20亿参数规格的模型,是CogVideoX …
ModelScope魔搭-阿里机器学习模型平台

ModelScope魔搭-阿里机器学习模型平台

ModelScope是阿里达摩院发布的汇聚各领域先进的机器学习模型的平台,提供模型探索体验、推理、训练、部署和应用的一站式服务。在这里,你可以共建模型开源社区,发现、学习、定制和分享你心仪的模型。,ModelScope是阿里达摩院发布的汇聚各领域先进的机器学习模型的平台,提供模型探索体验、推理、训练、部署和应用的一站式服务。在这里,你可以共建模型开源社区,发现、学习、定制和分享你心仪的模型。