AI资讯
-
Github重磅发布Agent模式和Copilot Edits,主动修复错误代码
微软宣布 GitHub Copilot 全面支持代理功能,推出首个自主SWE智能体。可自主迭代代码、修复错误、建议并执行终端命令。同时GitHub Copilot Edits上线,支持多…… -
全面对决Suno,国产AI音乐三巨头的突围之战
国内AI音乐领域三巨头——字节跳动的海绵音乐、昆仑万维的天工 SkyMusic 和趣丸科技的天谱乐,正与全球顶级产品Suno展开激烈竞争。通过提供个性化音乐生成、多模…… -
通义实验室开源 ClearerVoice-Studio,高效去除背景噪声
阿里通义实验室语音团队开源 ClearerVoice-Studio 技术框架,集成语音增强、分离和音视频说话人提取功能。通过复数域深度学习算法,有效消除背景噪声,保留语…… -
文小言电脑版正式发布,支持Windows和Mac免费下载,双端协同
文小言电脑版 正式发布,支持Windows和macOS系统免费下载,实现与APP的双端协同和消息互通。可以一键拖拽解析多种格式文件,针对原文提问,获得有据可依的回答…… -
巨人网络发布”千影”有声游戏大模型,加码”游戏+AI”赛道
巨人网络在2024年度中国游戏产业年会上发布” 千影 QianYing “有声游戏生成大模型,包括游戏视频生成大模型YingGame和视频配音大模型YingSound。YingGame支持开…… -
智谱完成30亿元新一轮融资,2024年商业化收入翻倍
AI独角兽“智谱”完成30亿元新一轮融资,投资方包括战投及国资,老股东君联资本跟投。资金将用于大模型研发,提升复杂多模态任务处理能力。2024年智谱商业化收入…… -
ElevenLabs推出Flash语音对话模型:仅75毫秒延迟,支持32种语言
ElevenLabs推出最新的人声合成模型 Flash ,宣称是目前最快的文本转语音解决方案,延迟仅为75毫秒,非常适合低延迟的对话式语音助手。Flash模型有两个版本,Fl…… -
马斯克 xAI 再放大招:网页版 Grok 上线,无需 X 账户
埃隆·马斯克旗下xAI公司推出网页版 Grok AI聊天机器人,无需X账户即可体验。访问grok.com,提供出生年份即可使用,能实时收集信息、获取答案、生成图像等。输…… -
k1.5 新模型登场:Kimi 如何做到满血版多模态o1水平
月之暗面推出全新 k1.5 多模态思考模型。模型在多模态推理和通用推理能力上达到SOTA水平,在short-CoT模式下,数学、代码、视觉多模态能力大幅超越全球短思考S…… -
扎克伯格持续建设“AI 帝国”:Meta 今年将投入最多 650 亿美元
Meta首席执行官马克・扎克伯格表示,公司今年计划投入最多650亿美元用于扩展AI基础设施,巩固其在与OpenAI和谷歌竞争中的地位。Meta将增加AI岗位的招聘,建设……