搜索内容

字节跳动推出 OmniHuman 多模态框架：图片+音频 = 逼真动画

来吧来吧27 • 2025年2月28日 am12:00 • AI资讯

字节跳动提出 OmniHuman ，基于扩散变换器的高保真人类视频生成框架。模型通过单阶段的音频和姿态驱动，能生成高质量的人类视频内容。支持文本、音频、姿态等多种输入信号，可生成从面部特写到全身的各种视频，适应不同风格。

版权声明：
作者：来吧来吧27
链接：https://deepseek-seo.net/%e5%ad%97%e8%8a%82%e8%b7%b3%e5%8a%a8%e6%8e%a8%e5%87%ba-omnihuman-%e5%a4%9a%e6%a8%a1%e6%80%81%e6%a1%86%e6%9e%b6%ef%bc%9a%e5%9b%be%e7%89%87%e9%9f%b3%e9%a2%91-%e9%80%bc%e7%9c%9f%e5%8a%a8%e7%94%bb-8/
来源：Deepseek SEO Hub
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

Deepseek SEO 是什么？

对话智谱CEO张鹏：大家对大模型期待过高，Scaling Law还有很大增长空间

下一篇>>

相关内容