VideoWorld开源：多方合作打造仅靠视觉认知世界的视频生成模型

来吧来吧27 • 2025年2月25日 am12:00 • AI资讯

字节跳动豆包大模型团队联合北京交通大学、中国科学技术大学发布的“ VideoWorld ”视频生成模型，现已开源。模型首次实现仅通过视觉信息认知世界，无需依赖语言模型即可学习和执行复杂任务，如围棋对战和机器人操控。VideoWorld采用潜在动态模型（LDM）压缩视频帧间变化信息，显著提升学习效率。

版权声明：
作者：来吧来吧27
链接：https://deepseek-seo.net/videoworld%e5%bc%80%e6%ba%90%ef%bc%9a%e5%a4%9a%e6%96%b9%e5%90%88%e4%bd%9c%e6%89%93%e9%80%a0%e4%bb%85%e9%9d%a0%e8%a7%86%e8%a7%89%e8%ae%a4%e7%9f%a5%e4%b8%96%e7%95%8c%e7%9a%84%e8%a7%86%e9%a2%91-7/
来源：Deepseek SEO Hub
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

DeepSeek 开源周首日推出 FlashMLA，为 Hopper GPU 优化的高效 MLA 解码内核

< <上一篇

对话智谱CEO张鹏：大家对大模型期待过高，Scaling Law还有很大增长空间

下一篇>>