AI资讯
-
刚刚!字节跳动豆包上线图片理解,大模型走向多模态
字节跳动 豆包 APP和PC端新增图片理解功能,能识别图片内容并回答相关问题,如景点位置和动漫人物身份。标志着AI大模型向多模态发展,更加实用。豆包已成为中…… -
英伟达发布大模型NVILA,专注于优化准确性和效率
英伟达发布新型开放式视觉语言模型 NVILA ,专注于提高准确性和效率。与LLaVa OneVision模型相比,NVILA的训练成本降低了4.5倍,微调内存减少了3.4倍,预填充…… -
谷歌发布智能体原型 Mariner,能帮用户操作表格、在线购物
谷歌发布名为 Mariner 的智能体原型,基于Gemini 2.0 AI模型,能自主浏览网站执行电子表格、在线购物等操作。Mariner旨在与用户协作,如在购物时可将商品加入…… -
OpenAI 推出 Projects,功能全家桶打造 ChatGPT 新交互方式,迈向“万能应用”
OpenAI在“OpenAI 12天”活动第7天推出了ChatGPT的新功能 Projects ,功能支持用户上传文件、自定义指令、分组聊天和数据管理,整合Canvas和ChatGPT Search,提…… -
小猿学练机发布:墨水屏+AI教育大模型,突破20毫秒手写延迟
猿辅导发布小猿学练机,集成AI教育大模型,提供个性化学习支持。设备整合296个教材版本、15亿题库和3亿精讲视频,升级六维能力图谱,提升AI数据处理效率。K12…… -
年终复盘 2024 AI搜索江湖,三大门派围攻光明顶
2024年,AI搜索赛道竞争激烈,互联网巨头、内容平台和AI创业公司纷纷入局。腾讯、百度、字节跳动等推出多款AI搜索产品,如搜狗输入法的AI搜索、360的 纳米搜索…… -
全球首个亿级参数量地震波大模型今年对外开放
全球首个亿级参数量地震波大模型“谛听”在国家超级计算机成都中心发布第三阶段测试版本,已成功应用于西藏定日6.8级地震数据处理。模型由中国地震局地球物理研…… -
字节启动 Seed Edge,加码 AGI 研究
字节跳动正式设立代号为“Seed Edge”的研究项目,专注于通用人工智能(AGI)的前沿研究。项目拟定五大研究方向,包括下一代推理、感知、软硬一体模型设计、新范…… -
DeepSeek推出人人可用的开源视觉多模态AI模型Janus-Pro
DeepSeek发布开源多模态AI模型 Janus-Pro ,包含10亿和70亿参数规模。模型在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion。Janus-P…… -
谷歌发布Gemini 2.0 Pro,全型号刷榜,原生多模态,编程、物理模拟能力炸裂
谷歌发布 Gemini 2.0 系列模型,包括 Gemini 2.0 Pro 、2.0 Flash 和 2.0 Flash-Lite。2.0 Pro 是谷歌最强的编码和复杂提示处理模型,配备 200 万 token 上下……