AI资讯
-
智谱AI 开源 GLM-PC 基座模型 CogAgent-9B,推动GUI交互自动化技术
智谱AI宣布开源GLM-PC基座模型 CogAgent-9B ,是基于GLM-4V-9B训练的专用Agent任务模型,能仅通过屏幕截图预测GUI操作。CogAgent-9B在GUI感知、推理预测准确性…… -
马斯克xAI获60亿美元新融资,和特斯拉和SpaceX大搞AI生态
马斯克的xAI公司宣布完成60亿美元C轮融资,主要投资方包括A16Z、Blackrock、富达管理研究公司等。英伟达和AMD作为战略投资者继续支持xAI基础设施扩展。资金将…… -
国货之光 DeepSeek V3 横空出世,多语言编程能力全面超越 Claude
幻方量化旗下人工智能公司深度求索(DeepSeek)开源的最新版AI模型 DeepSeek V3 ,拥有685B参数和256个专家的MoE架构,在aider多语言编程测评中超越Claude 3.5…… -
腾讯正式发布AI视频产品:腾讯混元文生视频,预计下月推出图生视频模型
腾讯今日正式推出了“ 腾讯混元文生视频 ”AI视频生成工具,该模型在指令遵循、动态表现、画面稳定性等方面表现出色,尤其在科幻、魔幻风格上给人惊喜。用户可以…… -
文小言电脑版正式发布,支持Windows和Mac免费下载,双端协同
文小言电脑版 正式发布,支持Windows和macOS系统免费下载,实现与APP的双端协同和消息互通。可以一键拖拽解析多种格式文件,针对原文提问,获得有据可依的回答…… -
Meta 发布 Motivo AI 模型,打造更逼真元宇宙体验
Meta发布 Meta Motivo AI模型,通过控制类人数字智能体的动作来提升元宇宙体验。模型基于行为训练,在Mujoco模拟器中使用AMASS动作捕捉数据集和3000万在线交互…… -
ElevenLabs推出Flash语音对话模型:仅75毫秒延迟,支持32种语言
ElevenLabs推出最新的人声合成模型 Flash ,宣称是目前最快的文本转语音解决方案,延迟仅为75毫秒,非常适合低延迟的对话式语音助手。Flash模型有两个版本,Fl…… -
「像素绽放PixelBloom」完成国家队B2轮融资,打造全球AI办公软件超级工场
AIGC科技企业“像素绽放PixelBloom”完成B2轮融资,由北京市人工智能产业投资基金领投。融资将用于产品研发和市场拓展,旨在打造全球AI办公软件超级工场。旗下 A…… -
星火浏览器插件新升级!能读会答、能翻译会总结
讯飞 星火浏览器插件 新升级,集成了讯飞星火V4.0底层能力,支持Chrome、Edge等主流浏览器。新增功能包括“继续提问”以深入讨论获取答案、网页全局对照翻译、一…… -
Qwen开源视觉推理模型QVQ,像物理学家一样更睿智地看世界!
Qwen团队发布开源多模态推理模型 QVQ ,基于Qwen2-VL-72B构建,提升AI的视觉理解和复杂问题解决能力。QVQ在MMMU评测中得分70.3,显著优于Qwen2-VL-72B-Instruc……

