• 手机快捷登录/注册
  • 账号登录

登录失败,用户名或者密码错误

登录

首页  > 快讯

智源发布原生多模态世界模型Emu3,实现图像、文本、视频大一统

2024-10-21 13:47:14
【智源发布原生多模态世界模型Emu3,实现图像、文本、视频大一统】智源研究院正式发布原生多模态世界模型Emu3。该模型只基于下一个token预测,无需扩散模型或组合方法,即可完成文本、图像、视频三种模态数据的理解和生成。据了解,Emu3在图像生成、视频生成、视觉语言理解等任务中超过了SDXL 、LLaVA、OpenSora等知名开源模型。

最新搜索

涨停 中国 汽车 A股 中信证券 比特币 特朗普 新能源 四连板 三连板 江淮汽车 北汽蓝谷 破净 st 哪吒汽车 以旧换新 越南 欣旺达 动力电池 中信建投 理想汽车 中国平安 美国大选 降息 三元电池 广交会 资产重组 房贷 黑神话:悟空 半导体 腾讯控股 上证指数 黑神话 存量房贷利率 AI出海 连板股 稀土 破净发 孚能科技 上交所 存量房贷 新能源汽车 智能驾驶 宁德时代 OpenAI 3000点 泸州老窖 中芯国际 电池回收 茅台 股票交易异常波动 大选 寻呼机 无人潜水器 今日收评 蜀道装备 AI模型公司 绝地求生 投票 悟空 存量房贷下调 润和软件 曲江文旅 弹匣电池 白马股 茅台酒价 贵州茅台