AI资讯
-
图森未来发布图生视频开源大模型“Ruyi”,RTX 4090就能运行
图森未来发布“ Ruyi ”图生视频大模型,开源Ruyi-Mini-7B版本。Ruyi基于DiT架构,包含Casual VAE模块和Diffusion Transformer,参数量约7.1B,支持在RTX 4090等…… -
快手可灵 1.6 模型发布:文本响应度、画面美感及运动合理性均有“明显提升”
可灵 近日推出了1.6版本,实现了图生视频的巨大飞跃。更新重点包括物理规律真实感、人物运动表演和语义理解的大幅提升。新版本在切食物、倒茶、跳舞等动作的物…… -
“深思熟虑”的 AI:OpenAI 提出全新安全对齐方法
OpenAI研究人员提出“ 深思熟虑的对齐 ”新方法,旨在提升AI模型安全性。该方法通过直接教授模型安全规范,并训练其在生成响应前推理这些准则,将安全原则融入推…… -
拓元智慧完成近亿元Pre-A轮融资,将聚焦多模态大模型与具身智能技术
拓元智慧(X-Era AI)宣布完成近亿元人民币的Pre-A轮融资,由粤科金融集团、鹏城愿景基金等投资。资金将用于加速多模态大模型和具身智能技术的研发。公司成立…… -
全面对决Suno,国产AI音乐三巨头的突围之战
国内AI音乐领域三巨头——字节跳动的海绵音乐、昆仑万维的天工 SkyMusic 和趣丸科技的天谱乐,正与全球顶级产品Suno展开激烈竞争。通过提供个性化音乐生成、多模…… -
通义实验室开源 ClearerVoice-Studio,高效去除背景噪声
阿里通义实验室语音团队开源 ClearerVoice-Studio 技术框架,集成语音增强、分离和音视频说话人提取功能。通过复数域深度学习算法,有效消除背景噪声,保留语…… -
文小言电脑版正式发布,支持Windows和Mac免费下载,双端协同
文小言电脑版 正式发布,支持Windows和macOS系统免费下载,实现与APP的双端协同和消息互通。可以一键拖拽解析多种格式文件,针对原文提问,获得有据可依的回答…… -
巨人网络发布”千影”有声游戏大模型,加码”游戏+AI”赛道
巨人网络在2024年度中国游戏产业年会上发布” 千影 QianYing “有声游戏生成大模型,包括游戏视频生成大模型YingGame和视频配音大模型YingSound。YingGame支持开…… -
智谱完成30亿元新一轮融资,2024年商业化收入翻倍
AI独角兽“智谱”完成30亿元新一轮融资,投资方包括战投及国资,老股东君联资本跟投。资金将用于大模型研发,提升复杂多模态任务处理能力。2024年智谱商业化收入…… -
ElevenLabs推出Flash语音对话模型:仅75毫秒延迟,支持32种语言
ElevenLabs推出最新的人声合成模型 Flash ,宣称是目前最快的文本转语音解决方案,延迟仅为75毫秒,非常适合低延迟的对话式语音助手。Flash模型有两个版本,Fl……

