360智脑-视觉大模型

1个月前更新 56 0 0

视觉大模型能看懂图片,未来看懂视频、听懂声音,视觉大模型能看懂图片,未来看懂视频、听懂声音

收录时间:
2024-09-11
360智脑-视觉大模型360智脑-视觉大模型

5 月 31 日消息,360 举办视觉大模型及 AI 硬件新品发布会,推出了 360 智脑・视觉大模型及多款 AI 硬件新品,并宣布 360 智慧生活正式进军 SMB 市场。

周鸿祎在发布会上表示,所有软件、App、网站,所有行业都值得用大模型进行重塑,而智能硬件是硬件化的 App。从大模型的发展趋势来看,多模态是大模型发展的必经之路,GPT-4 最重要的变化是拥有了多模态的处理能力。周鸿祎预言,多模态大模型与物联网的结合将会成为下一个风口。

360智脑-视觉大模型

360 在视觉感知能力基础上,融合千亿参数“360 智脑”大模型,基于十亿级互联网图文数据进行清洗训练,并针对安防场景百万级行业数据进行微调,最终打造出视觉及多模态大模型 ——360 智脑-视觉大模型。视觉大模型是“360 智脑”的重要能力组成,使其能看懂图片,未来看懂视频、听懂声音。

周鸿祎表示:“目前,大模型的能力主要体现在软件层,当大模型接入智能硬件,会让大模型的能力从数字世界走向物理世界。”

官网地址:https://ai.360.cn/

数据统计

相关导航

讯飞星火语音大模型

讯飞星火语音大模型

讯飞星火认知大模型是科大讯飞推出的AI大语言模型,专注于提供高精度的语音识别和超拟人化的语音合成服务。它支持多种语言和方言,具备自动语种判断和智能标点功能,能够实现流畅的语音转文字和自然口语的语音输出。该模型适用于语音搜索、聊天输入、游戏娱乐、人机交互、智能客服等多个场景,为企业和开发者提供了强大的语音交互解决方案。,讯飞星火认知大模型是科大讯飞推出的AI大语言模型,专注于提供高精度的语音识别和超拟人化的语音合成服务。它支持多种语言和方言,具备自动语种判断和智能标点功能,能够实现流畅的语音转文字和自然口语的语音输出…
Qwen2-Math:阿里巴巴最新开源的数学推理大模型

Qwen2-Math:阿里巴巴最新开源的数学推理大模型

Qwen2-Math是阿里巴巴最新开源的数学推理大模型,是基于 Qwen2 LLM 构建的专门用于数学解题的一系列语言模型。Qwen2-Math 提供了基础和指令微调两种版本,分别有1.5B(15亿)、7B(79亿)和72B(720亿)三种参数规模,以适应不同的应用需求。,Qwen2-Math是阿里巴巴最新开源的数学推理大模型,是基于 Qwen2 LLM 构建的专门用于数学解题的一系列语言模型。Qwen2-Math 提供了基础和指令微调两种版本,分别有1.5B(15亿)…
Octopus V2-斯坦福推出的可在设备上运行的大模型

Octopus V2-斯坦福推出的可在设备上运行的大模型

Octopus v2是一个拥有20亿参数的模型,能够在智能手机、汽车、个人电脑等设备上运行。它在准确性和延迟方面超越了GPT-4,且将上下文长度减少了95%。与基于RAG的Llama7B模型相比,Octopus v2的速度快了36倍。,Octopus v2是一个拥有20亿参数的模型,能够在智能手机、汽车、个人电脑等设备上运行。它在准确性和延迟方面超越了GPT-4,且将上下文长度减少了95%。与基于RAG的Llama7B模型相比,Oc…