AI资讯
-
Qwen开源视觉推理模型QVQ,像物理学家一样更睿智地看世界!
Qwen团队发布开源多模态推理模型 QVQ ,基于Qwen2-VL-72B构建,提升AI的视觉理解和复杂问题解决能力。QVQ在MMMU评测中得分70.3,显著优于Qwen2-VL-72B-Instruc…… -
阶跃星辰语言模型上新:既有文学大师,又有性价比之王
上海阶跃星辰推出Step系列语言模型的两位新成员: Step-2 mini 和Step-2文学大师版。Step-2 mini是轻量级模型,仅用3%的参数量保留了Step-2模型80%以上的性能…… -
Perplexity发布Sonar API,提供实时信息搜索功能
Perplexity发布 Sonar API,提供实时信息搜索功能。Sonar API分为基础版和Pro版,基础版支持轻量级实时搜索和简单查询引用,Pro版则支持复杂多步骤任务、更大…… -
OpenAI发布新的推理模型o3-mini,性能提升 24%
OpenAI发布新的推理模型 o3-mini ,是推理系列中最具成本效益的模型。o3-mini在科学、数学和编程等STEM领域表现出色,保持低延迟和低成本。支持函数调用、结构…… -
可图 1.5 图像模型来啦!全新「AI模特」功能上线
快手 可灵AI (Kling)团队发布可图1.5图像模型,模型在画面质量和美感上大幅提升。AI试衣新增“AI模特”功能,借助可灵1.6图生视频能力,用户只需输入文本描述…… -
豆包实时语音大模型上线即开放!情商智商双高
字节跳动旗下的豆包大模型团队宣布推出 豆包 实时语音大模型,在豆包APP全量开放。模型是语音理解和生成一体化的端到端语音系统,主要面向中文语境,支持英语…… -
Step-Video 开年震撼升级:更强大的真实世界模拟器来了
阶跃星辰推出视频生成模型 Step-Video V2 版本。新版本在参数量、语义理解、指令遵循能力等方面大幅提升,支持复杂运动、人物美感、基础文字生成和多语言输入…… -
可灵AI API新增【虚拟试穿V1.5】和【对口型】
快手 可灵AI (Kling)宣布API能力升级,推出虚拟试穿V1.5模型,支持单件及组合服装输入,能生成试衣视频。同时,新增对口型功能,可实现视频中人物口型与配音…… -
字节跳动推出全新AI IDE:Trae,基于Claude模型免费使用
字节跳动正式发布全新AI编程IDE—— Trae ,对标Cursor!支持原生中文,集成Claude 3.5、GPT-4o等顶级AI模型,免费开放使用。具备智能代码生成与优化、AI驱动的C…… -
字节跳动推出的开源原生 GUI 代理模型
字节跳动发布并开源了 UI-TARS 大模型,是专门用于操控电脑界面的视觉语言模型,具备感知、推理和操作能力。UI-TARS提供2B、7B和72B三种参数规模版本,支持跨……

