三波知识百科

展开菜单

NVIDIA发布Cosmos 3:全球首个全开源物理AI全能模型面世

NVIDIA发布Cosmos 3:全球首个全开源物理AI全能模型面世
快科技6月4日消息,据媒体报道,英伟达在台北举办的GTC活动上正式发布Cosmos 3,并将其称为全球首个“完全开放的全能模型”。该模型面向机器人、自动驾驶汽车及视觉智能体,主打基于视觉的推理能力,同时可生成文本、图像、视频、环境声音和动作等多模态内容。据英伟达介绍,Cosmos 3采用由推理Transformer与生成Transformer组成的双模块架构。其中,推理Transformer负责理解物体交互、运动轨迹及时空关系,生成Transformer则在此基础上输出视频内...