AI资讯
-
Qwen开源视觉推理模型QVQ,像物理学家一样更睿智地看世界!
Qwen团队发布开源多模态推理模型 QVQ ,基于Qwen2-VL-72B构建,提升AI的视觉理解和复杂问题解决能力。QVQ在MMMU评测中得分70.3,显著优于Qwen2-VL-72B-Instruc…… -
阶跃星辰图像生成模型全新升级:支持「图生图」,一键风格迁移!
阶跃星辰宣布其图像生成模型 Step-1X 系列的全新升级版本Step-1X-Medium,性能提升30%,增强了理解能力和图文一致性,支持“图生图”功能,实现细节增强、风格迁…… -
国货之光 DeepSeek V3 横空出世,多语言编程能力全面超越 Claude
幻方量化旗下人工智能公司深度求索(DeepSeek)开源的最新版AI模型 DeepSeek V3 ,拥有685B参数和256个专家的MoE架构,在aider多语言编程测评中超越Claude 3.5…… -
OpenAI考虑在AI产品中引入广告
OpenAI首席财务官Sarah Friar透露,公司正在考虑将广告引入AI产品中,寻求新的收入来源。目前没有积极推进广告业务的计划,公司对探索其他收入渠道持开放态度…… -
OpenAI第一场直播就炸场!o1满血版上线,ChatGPT Pro订阅费:200美元/月
OpenAI发布最强推理模型 o1 满血版及其Pro版本,ChatGPT Pro订阅计划定价为200美金/月,成为全球最贵的大模型订阅服务。满血版o1在数学、代码能力上显著提升,…… -
全网热评的李飞飞世界生成模型,真的能构建物理世界吗?
李飞飞的空间智能World Labs发布了世界生成模型,一个能从单张图片生成3D物理世界的AI系统,引起AI界热议。该技术突破在于直接生成三维场景,遵循物理规则,具…… -
豆包大模型团队开源FullStack Bench代码全新基准,覆盖超11类真实编程场景
字节跳动豆包大模型团队开源全栈编程代码评估数据集 FullStack Bench 。FullStack Bench覆盖超11类真实编程场景和16种编程语言,包含3374个问题,有效评估大模…… -
快手预告“可灵 AI”导演共创计划作品 12 月 6 日上线:联合李少红、贾樟柯、叶锦添、薛晓路等
快手宣布“ 可灵AI ”导演共创计划作品将于12月6日上线,计划自9月9日启动,由9位导演联合发起,涵盖多种题材。9部短片全部由可灵AI进行视频生成。可灵AI服务用…… -
谷歌DeepMind推出AI气象预测模型GenCast,8分钟预测15日天气
DeepMind气象预测大模型 GenCast 在Nature发表,能在8分钟内完成15天的天气预报,准确度超过全球顶尖中期天气预报系统ENS。GenCast基于扩散模型和Transformer…… -
全面对决Suno,国产AI音乐三巨头的突围之战
国内AI音乐领域三巨头——字节跳动的海绵音乐、昆仑万维的天工 SkyMusic 和趣丸科技的天谱乐,正与全球顶级产品Suno展开激烈竞争。通过提供个性化音乐生成、多模……