AI资讯
-
通义实验室开源 ClearerVoice-Studio,高效去除背景噪声
阿里通义实验室语音团队开源 ClearerVoice-Studio 技术框架,集成语音增强、分离和音视频说话人提取功能。通过复数域深度学习算法,有效消除背景噪声,保留语…… -
英伟达发布大模型NVILA,专注于优化准确性和效率
英伟达发布新型开放式视觉语言模型 NVILA ,专注于提高准确性和效率。与LLaVa OneVision模型相比,NVILA的训练成本降低了4.5倍,微调内存减少了3.4倍,预填充…… -
OpenAI 加速普及 ChatGPT,开通免费热线电话,老人机也能用ChatGPT了
OpenAI直播第10天,在美国推出 ChatGPT 热线电话服务,号码是:1-800-ChatGPT,也可以打1-800-242-8478,每月可免费通话15分钟,支持智能手机、老人机和座机各…… -
实测腾讯元宝2.0:图文视频啥都能搜,论文绘画全搞定
腾讯元宝2.0 全新升级,集成AI搜索、阅读、生图等功能,打通公众号、视频号等资源,提供深度研究、脑图整理服务。新增创意绘画、灵感图库、AI美照等图片功能,…… -
星火浏览器插件新升级!能读会答、能翻译会总结
讯飞 星火浏览器插件 新升级,集成了讯飞星火V4.0底层能力,支持Chrome、Edge等主流浏览器。新增功能包括“继续提问”以深入讨论获取答案、网页全局对照翻译、一…… -
Meta 推出 Apollo 开源模型,让 AI “看懂”视频
Meta与斯坦福大学合作推出 Apollo 系列AI模型,提升机器对视频的理解能力。Apollo模型包含两个组件,分别处理视频帧和跟踪对象及场景变化,在视频片段间添加时…… -
k1.5 新模型登场:Kimi 如何做到满血版多模态o1水平
月之暗面推出全新 k1.5 多模态思考模型。模型在多模态推理和通用推理能力上达到SOTA水平,在short-CoT模式下,数学、代码、视觉多模态能力大幅超越全球短思考S…… -
OpenAI 加速普及 ChatGPT,开通免费热线电话,老人机也能用ChatGPT了
OpenAI直播第10天,在美国推出 ChatGPT 热线电话服务,号码是:1-800-ChatGPT,也可以打1-800-242-8478,每月可免费通话15分钟,支持智能手机、老人机和座机各…… -
中国电信发布“复杂推理大模型”TeleAI-t1-preview:能解《九章算术》题目
中国电信人工智能研究院发布“复杂推理大模型” TeleAI-t1-preview ,即将上线天翼AI开放平台。模型采用强化学习训练方法,引入探索、反思等思考范式,提升逻辑…… -
《麻省理工科技评论》点评中国AI“四剑客”,每家都媲美DeepSeek
DeepSeek凭借低训练成本和高性能的开源模型引发全球关注。《麻省理工科技评论》指出,除DeepSeek外,中国还有四家AI初创公司展现出强大的技术实力,包括阶跃星……