AI资讯
-
字节跳动推出 OmniHuman 多模态框架:图片+音频 = 逼真动画
字节跳动提出 OmniHuman ,基于扩散变换器的高保真人类视频生成框架。模型通过单阶段的音频和姿态驱动,能生成高质量的人类视频内容。支持文本、音频、姿态等…… -
VideoWorld开源:多方合作打造仅靠视觉认知世界的视频生成模型
字节跳动豆包大模型团队联合北京交通大学、中国科学技术大学发布的“ VideoWorld ”视频生成模型,现已开源。模型首次实现仅通过视觉信息认知世界,无需依赖语言…… -
谷歌 Gemini 宣布上线“全局记忆”功能,订阅用户可令 AI 回忆曾经所有对话
谷歌 Gemini AI上线“全局记忆”功能,订阅Gemini Advanced服务的用户可在App和网页端体验。AI能记住用户所有对话,提供更个性化的回复。用户无需跳转历史记录即…… -
xAI 发布 Grok 3 聊天机器人,性能较前代提升十倍
马斯克旗下xAI公司发布新一代大模型 Grok 3 ,Grok 3在数学推理、科学逻辑和代码写作等能力上表现卓越,超越DeepSeek-v3、GPT-4o和Gemini-2 Pro等模型。开发依…… -
马斯克宣布 Grok 3 语音模式早期测试版已上线
马斯克在社交平台X宣布, Grok 3 语音模式早期测试版已在Grok应用程序上线。支持用户通过自然语言与AI对话,提供两种声音(Ara和Grok)及不同个性,支持添加自…… -
Anthropic 全面开放 Claude AI 的 GitHub 集成,赋能所有开发者
Anthropic宣布全面开放 Claude AI 的GitHub集成,面向免费、Pro和Teams用户。集成后,用户可将GitHub代码库同步至Claude,使其理解代码上下文,辅助测试、调试…… -
海螺AI推出全新 S2V-01 主体参考模型,AI视频创作再上新台阶
海螺AI 推出全新S2V-01主体参考模型,支持用户通过上传一张参考图片,生成与原图高度一致的角色视频。显著提升AI视频创作的效率和质量,使得每一帧画面都能完…… -
Vidu 2.0全新升级,更快、更强、更稳定
Vidu 2.0正式上线,带来生成速度与画质的双重突破,10秒即可出片。效果升级,视频风格、主体更一致,首尾帧更自然。推出超值套餐,成本低至4分/秒。新增错峰模…… -
香港大学携手快手科技推出 GameFactory 框架,突破游戏场景泛化难题
香港大学与快手科技联合推出 GameFactory 框架,旨在解决游戏视频生成中的场景泛化难题。框架基于在开放域视频数据上预训练的视频扩散模型,可生成多样化游戏…… -
豆包大模型1.5正式发布,全面上线火山方舟
字节跳动旗下火山引擎正式发布 豆包大模型1.5 Pro 。模型在知识、代码、推理、中文等多个权威测评基准上表现优异,综合得分超越GPT-4o、Claude 3.5 Sonnet等业……

