AI资讯
-
快手可灵 1.6 模型发布:文本响应度、画面美感及运动合理性均有“明显提升”
可灵 近日推出了1.6版本,实现了图生视频的巨大飞跃。更新重点包括物理规律真实感、人物运动表演和语义理解的大幅提升。新版本在切食物、倒茶、跳舞等动作的物…… -
支付宝「探一下」新一代AI视觉搜索产品,满足你的好奇心
支付宝推出新功能“ 探一下 ”,基于自研的多模态大模型技术,能够“用AI之眼探索万物”,提供快速、有用、趣味的生成式搜索服务。“探一下”提供三种核心服务:探知…… -
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
深度求索发布 DeepSeek-R1 模型,并开源模型权重。DeepSeek-R1通过强化学习技术大幅提升推理能力,在数学、代码和自然语言推理等任务上性能对标OpenAI o1正式…… -
OpenAI正式发布智能体Operator!能推理、联网自主执行任务
OpenAI推出“ Operator ”AI代理,Operator依托Computer-Using Agent(CUA)模型,结合GPT-4o的视觉能力和强化学习推理能力,能自动完成多种在线任务,如预订餐…… -
SB OpenAI Japan成立!2025年首个最火AI赛道开打
OpenAI在日本宣布成立合资公司 SB OpenAI Japan,与软银合作,专注于开发和销售新型高级企业AI——“水晶智能(Cristal intelligence)”。合作为日本企业提供定制…… -
Github重磅发布Agent模式和Copilot Edits,主动修复错误代码
微软宣布 GitHub Copilot 全面支持代理功能,推出首个自主SWE智能体。可自主迭代代码、修复错误、建议并执行终端命令。同时GitHub Copilot Edits上线,支持多…… -
全面对决Suno,国产AI音乐三巨头的突围之战
国内AI音乐领域三巨头——字节跳动的海绵音乐、昆仑万维的天工 SkyMusic 和趣丸科技的天谱乐,正与全球顶级产品Suno展开激烈竞争。通过提供个性化音乐生成、多模…… -
通义实验室开源 ClearerVoice-Studio,高效去除背景噪声
阿里通义实验室语音团队开源 ClearerVoice-Studio 技术框架,集成语音增强、分离和音视频说话人提取功能。通过复数域深度学习算法,有效消除背景噪声,保留语…… -
文小言电脑版正式发布,支持Windows和Mac免费下载,双端协同
文小言电脑版 正式发布,支持Windows和macOS系统免费下载,实现与APP的双端协同和消息互通。可以一键拖拽解析多种格式文件,针对原文提问,获得有据可依的回答…… -
巨人网络发布”千影”有声游戏大模型,加码”游戏+AI”赛道
巨人网络在2024年度中国游戏产业年会上发布” 千影 QianYing “有声游戏生成大模型,包括游戏视频生成大模型YingGame和视频配音大模型YingSound。YingGame支持开……

