AI资讯
-
久等了,DeepSeek开源 DeepSeek-VL2 MoE视觉模型:支持动态分辨率、解析梗图等
DeepSeek推出 DeepSeek-VL2 AI视觉模型,模型采用DeepSeek-MoE架构结合动态切图技术,提升视觉能力。模型在视觉定位、梗图解析、OCR和故事生成等方面展现出新…… -
豆包大模型家族全面升级,重磅发布视觉理解模型
字节跳动旗下火山引擎发布豆包大模型家族全面升级,包括 视觉理解模型 ,能同时处理文本和图像问题,提供准确回答,大幅降低开发流程复杂度。模型在教育、旅游…… -
上海国资和腾讯联手投资,“大模型六虎”阶跃星辰获数亿美元B轮融资
AI大模型独角兽阶跃星辰完成数亿美元B轮融资,投资方包括上海国有资本投资有限公司、腾讯投资等。本轮融资将用于基础模型研发,强化多模态和复杂推理能力,扩…… -
腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”
腾讯研究院推出 DRT-o1 系列AI模型,通过长链思考推理技术,提升文学作品翻译质量,尤其是在理解比喻和隐喻方面。模型采用多智能体框架,包括翻译员、顾问和评…… -
大模型的2024年:我们对AI的发展脱敏了
2024年AI领域发展迅速,大模型更实用但不再惊艳,端侧模型和混合专家技术(MoE)降低成本,多模态研究成新方向。AI搜索、语音交互、视频技术商业化挑战中前行…… -
中国电信发布“复杂推理大模型”TeleAI-t1-preview:能解《九章算术》题目
中国电信人工智能研究院发布“复杂推理大模型” TeleAI-t1-preview ,即将上线天翼AI开放平台。模型采用强化学习训练方法,引入探索、反思等思考范式,提升逻辑…… -
中国电信发布“复杂推理大模型”TeleAI-t1-preview:能解《九章算术》题目
中国电信人工智能研究院发布“复杂推理大模型” TeleAI-t1-preview ,即将上线天翼AI开放平台。模型采用强化学习训练方法,引入探索、反思等思考范式,提升逻辑…… -
刚刚!字节跳动豆包上线图片理解,大模型走向多模态
字节跳动 豆包 APP和PC端新增图片理解功能,能识别图片内容并回答相关问题,如景点位置和动漫人物身份。标志着AI大模型向多模态发展,更加实用。豆包已成为中…… -
英伟达发布大模型NVILA,专注于优化准确性和效率
英伟达发布新型开放式视觉语言模型 NVILA ,专注于提高准确性和效率。与LLaVa OneVision模型相比,NVILA的训练成本降低了4.5倍,微调内存减少了3.4倍,预填充…… -
谷歌发布智能体原型 Mariner,能帮用户操作表格、在线购物
谷歌发布名为 Mariner 的智能体原型,基于Gemini 2.0 AI模型,能自主浏览网站执行电子表格、在线购物等操作。Mariner旨在与用户协作,如在购物时可将商品加入……

