字节跳动推出 OmniHuman 多模态框架:图片+音频 = 逼真动画
字节跳动提出 OmniHuman ,基于扩散变换器的高保真人类视频生成框架。模型通过单阶段的音频和姿态驱动,能生成高质量的人类视频内容。支持文本、音频、姿态等多种输入信号,可生成从面部特写到全身的各种视频,适应不同风格。
版权声明:
作者:来吧来吧27
链接:https://deepseek-seo.net/%e5%ad%97%e8%8a%82%e8%b7%b3%e5%8a%a8%e6%8e%a8%e5%87%ba-omnihuman-%e5%a4%9a%e6%a8%a1%e6%80%81%e6%a1%86%e6%9e%b6%ef%bc%9a%e5%9b%be%e7%89%87%e9%9f%b3%e9%a2%91-%e9%80%bc%e7%9c%9f%e5%8a%a8%e7%94%bb-8/
来源:Deepseek SEO Hub
文章版权归作者所有,未经允许请勿转载。
THE END
二维码