AI资讯
-
久等了,DeepSeek开源 DeepSeek-VL2 MoE视觉模型:支持动态分辨率、解析梗图等
DeepSeek推出 DeepSeek-VL2 AI视觉模型,模型采用DeepSeek-MoE架构结合动态切图技术,提升视觉能力。模型在视觉定位、梗图解析、OCR和故事生成等方面展现出新…… -
豆包大模型家族全面升级,重磅发布视觉理解模型
字节跳动旗下火山引擎发布豆包大模型家族全面升级,包括 视觉理解模型 ,能同时处理文本和图像问题,提供准确回答,大幅降低开发流程复杂度。模型在教育、旅游…… -
上海国资和腾讯联手投资,“大模型六虎”阶跃星辰获数亿美元B轮融资
AI大模型独角兽阶跃星辰完成数亿美元B轮融资,投资方包括上海国有资本投资有限公司、腾讯投资等。本轮融资将用于基础模型研发,强化多模态和复杂推理能力,扩…… -
腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”
腾讯研究院推出 DRT-o1 系列AI模型,通过长链思考推理技术,提升文学作品翻译质量,尤其是在理解比喻和隐喻方面。模型采用多智能体框架,包括翻译员、顾问和评…… -
IBM 发布新语言模型 Granite 3.1,性能、上下文能力增强
IBM发布大语言模型新版本 Granite 3.1 ,相较于3.0版本,Granite 3.1采用了更密集的架构,能处理多达128,000个令牌,显著提升了处理复杂文本的能力。版本包含8…… -
刚刚!字节跳动豆包上线图片理解,大模型走向多模态
字节跳动 豆包 APP和PC端新增图片理解功能,能识别图片内容并回答相关问题,如景点位置和动漫人物身份。标志着AI大模型向多模态发展,更加实用。豆包已成为中…… -
英伟达发布大模型NVILA,专注于优化准确性和效率
英伟达发布新型开放式视觉语言模型 NVILA ,专注于提高准确性和效率。与LLaVa OneVision模型相比,NVILA的训练成本降低了4.5倍,微调内存减少了3.4倍,预填充…… -
谷歌发布智能体原型 Mariner,能帮用户操作表格、在线购物
谷歌发布名为 Mariner 的智能体原型,基于Gemini 2.0 AI模型,能自主浏览网站执行电子表格、在线购物等操作。Mariner旨在与用户协作,如在购物时可将商品加入…… -
OpenAI 推出 Projects,功能全家桶打造 ChatGPT 新交互方式,迈向“万能应用”
OpenAI在“OpenAI 12天”活动第7天推出了ChatGPT的新功能 Projects ,功能支持用户上传文件、自定义指令、分组聊天和数据管理,整合Canvas和ChatGPT Search,提…… -
小猿学练机发布:墨水屏+AI教育大模型,突破20毫秒手写延迟
猿辅导发布小猿学练机,集成AI教育大模型,提供个性化学习支持。设备整合296个教材版本、15亿题库和3亿精讲视频,升级六维能力图谱,提升AI数据处理效率。K12……

