最新文章
-
国货之光 DeepSeek V3 横空出世,多语言编程能力全面超越 Claude
幻方量化旗下人工智能公司深度求索(DeepSeek)开源的最新版AI模型 DeepSeek V3 ,拥有685B参数和256个专家的MoE架构,在aider多语言编程测评中超越Claude 3.5…… -
智谱AI 开源 GLM-PC 基座模型 CogAgent-9B,推动GUI交互自动化技术
智谱AI宣布开源GLM-PC基座模型 CogAgent-9B ,是基于GLM-4V-9B训练的专用Agent任务模型,能仅通过屏幕截图预测GUI操作。CogAgent-9B在GUI感知、推理预测准确性…… -
阶跃星辰图像生成模型全新升级:支持「图生图」,一键风格迁移!
阶跃星辰宣布其图像生成模型 Step-1X 系列的全新升级版本Step-1X-Medium,性能提升30%,增强了理解能力和图文一致性,支持“图生图”功能,实现细节增强、风格迁…… -
腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”
腾讯研究院推出 DRT-o1 系列AI模型,通过长链思考推理技术,提升文学作品翻译质量,尤其是在理解比喻和隐喻方面。模型采用多智能体框架,包括翻译员、顾问和评…… -
通义从阿里云分拆,并入阿里智能信息事业群,与“夸克”平级
阿里巴巴旗下的AI应用通义从阿里云分拆,加入智能信息事业群,正式转向C端市场。通义系列由达摩院研发,是阿里AI领域的拳头产品。此次调整意味着通义将与 Kimi…… -
小米正搭建GPU万卡集群,将对AI大模型大力投入
小米正在搭建GPU万卡集群,对AI大模型进行大力投入。该计划已实施数月,小米大模型团队成立时已拥有6500张GPU资源。DeepSeek-V2的关键开发者之一罗福莉,将加…… -
科大讯飞连续中标7大AI项目,两个月内狂揽11亿大单
科大讯飞旗下讯飞智元中标山东泰安市肥城人工智能行业大模型应用基地项目,投标金额约1.59亿元。项目内容包括智算中心基础设施建设,涉及基建、硬件平台和基础…… -
Qwen开源视觉推理模型QVQ,像物理学家一样更睿智地看世界!
Qwen团队发布开源多模态推理模型 QVQ ,基于Qwen2-VL-72B构建,提升AI的视觉理解和复杂问题解决能力。QVQ在MMMU评测中得分70.3,显著优于Qwen2-VL-72B-Instruc…… -
IBM 发布新语言模型 Granite 3.1,性能、上下文能力增强
IBM发布大语言模型新版本 Granite 3.1 ,相较于3.0版本,Granite 3.1采用了更密集的架构,能处理多达128,000个令牌,显著提升了处理复杂文本的能力。版本包含8…… -
“深思熟虑”的 AI:OpenAI 提出全新安全对齐方法
OpenAI研究人员提出“ 深思熟虑的对齐 ”新方法,旨在提升AI模型安全性。该方法通过直接教授模型安全规范,并训练其在生成响应前推理这些准则,将安全原则融入推……
友情链接