AI资讯
-
VideoWorld开源:多方合作打造仅靠视觉认知世界的视频生成模型
字节跳动豆包大模型团队联合北京交通大学、中国科学技术大学发布的“ VideoWorld ”视频生成模型,现已开源。模型首次实现仅通过视觉信息认知世界,无需依赖语言…… -
亚马逊年末甩王炸!6款大模型、3nm AI芯片、全球最大AI计算集群,苹果罕见站台
亚马逊在AWS re:Invent大会上宣布将推出6款大模型和3nm第三代AI训练芯片Trainum3,以及最强AI服务器Trn2 UltraServer。 Amazon Nova系列模型 涵盖文本、图像和…… -
智谱AI再放大招!全新多模态模型 GLM-4V-Flash 免费开放!
智谱AI推出首个免费多模态模型 GLM-4V-Flash ,该模型基于4V系列,提升图像处理精确度,降低开发门槛。模型支持26种语言,具备图像描述生成、分类等高级功能,…… -
全球首个”AI 程序员”Devin 全面开放:可独立开发/修复bug,月费500美元
全球首个AI程序员 Devin 已全面开放,支持个人开发者和团队以每月500美元订阅服务,包括Slack集成、IDE扩展和技术支持。Devin能熟练使用多种编程语言,独立完…… -
久等了,DeepSeek开源 DeepSeek-VL2 MoE视觉模型:支持动态分辨率、解析梗图等
DeepSeek推出 DeepSeek-VL2 AI视觉模型,模型采用DeepSeek-MoE架构结合动态切图技术,提升视觉能力。模型在视觉定位、梗图解析、OCR和故事生成等方面展现出新…… -
豆包大模型家族全面升级,重磅发布视觉理解模型
字节跳动旗下火山引擎发布豆包大模型家族全面升级,包括 视觉理解模型 ,能同时处理文本和图像问题,提供准确回答,大幅降低开发流程复杂度。模型在教育、旅游…… -
阿里入局 AI 眼镜:与雷鸟达成战略合作,产品将接入通义大模型
雷鸟创新与阿里云达成AI眼镜领域的独家战略合作,阿里云通义大模型将为雷鸟AI眼镜提供技术支持。是国内首次大模型与AI眼镜硬件厂商深度定制合作。双方将共同投…… -
香港大学携手快手科技推出 GameFactory 框架,突破游戏场景泛化难题
香港大学与快手科技联合推出 GameFactory 框架,旨在解决游戏视频生成中的场景泛化难题。框架基于在开放域视频数据上预训练的视频扩散模型,可生成多样化游戏…… -
豆包大模型1.5正式发布,全面上线火山方舟
字节跳动旗下火山引擎正式发布 豆包大模型1.5 Pro 。模型在知识、代码、推理、中文等多个权威测评基准上表现优异,综合得分超越GPT-4o、Claude 3.5 Sonnet等业…… -
通义开源两大AI模型:支持理解长视频和捕捉事件等能力
通义开源两大AI模型: Qwen2.5-VL 和 Qwen2.5-1M 。Qwen2.5-VL推出3B、7B和72B三个版本,全面超越GPT-4o与Claude3.5。模型支持超1小时的视频理解,无需微调即……