AI资讯
-
马斯克宣布 Grok 3 语音模式早期测试版已上线
马斯克在社交平台X宣布, Grok 3 语音模式早期测试版已在Grok应用程序上线。支持用户通过自然语言与AI对话,提供两种声音(Ara和Grok)及不同个性,支持添加自…… -
全面对决Suno,国产AI音乐三巨头的突围之战
国内AI音乐领域三巨头——字节跳动的海绵音乐、昆仑万维的天工 SkyMusic 和趣丸科技的天谱乐,正与全球顶级产品Suno展开激烈竞争。通过提供个性化音乐生成、多模…… -
通义实验室开源 ClearerVoice-Studio,高效去除背景噪声
阿里通义实验室语音团队开源 ClearerVoice-Studio 技术框架,集成语音增强、分离和音视频说话人提取功能。通过复数域深度学习算法,有效消除背景噪声,保留语…… -
文小言电脑版正式发布,支持Windows和Mac免费下载,双端协同
文小言电脑版 正式发布,支持Windows和macOS系统免费下载,实现与APP的双端协同和消息互通。可以一键拖拽解析多种格式文件,针对原文提问,获得有据可依的回答…… -
巨人网络发布”千影”有声游戏大模型,加码”游戏+AI”赛道
巨人网络在2024年度中国游戏产业年会上发布” 千影 QianYing “有声游戏生成大模型,包括游戏视频生成大模型YingGame和视频配音大模型YingSound。YingGame支持开…… -
智谱完成30亿元新一轮融资,2024年商业化收入翻倍
AI独角兽“智谱”完成30亿元新一轮融资,投资方包括战投及国资,老股东君联资本跟投。资金将用于大模型研发,提升复杂多模态任务处理能力。2024年智谱商业化收入…… -
ElevenLabs推出Flash语音对话模型:仅75毫秒延迟,支持32种语言
ElevenLabs推出最新的人声合成模型 Flash ,宣称是目前最快的文本转语音解决方案,延迟仅为75毫秒,非常适合低延迟的对话式语音助手。Flash模型有两个版本,Fl…… -
IBM 发布新语言模型 Granite 3.1,性能、上下文能力增强
IBM发布大语言模型新版本 Granite 3.1 ,相较于3.0版本,Granite 3.1采用了更密集的架构,能处理多达128,000个令牌,显著提升了处理复杂文本的能力。版本包含8…… -
PixVerse V3.5 正式上线,模型全面升级,10秒极速生成
爱诗科技宣布 PixVerse V3.5 版本正式上线,新版本在Turbo模式下10秒内即可生成高质量视频,保持行业领先的语义理解和细节表现力。动漫生成效果显著提升,支持…… -
微软发布新模型 LAM ,可以自己操作Windows程序
微软推出 LAM (Large Action Model)“大型动作模型” ,能够独立操作Windows程序,将用户请求转化为实际行动。是首个专门训练与微软Office产品一起工作的模型……