AI资讯
-
如何识别AI生成图片?腾讯上线「鉴别工具」
腾讯上线由腾讯混元安全团队朱雀实验室研发的 朱雀大模型检测 工具,旨在帮助用户识别AI生成的图像和AI生成文本检测系统。通过检测图片中的纹理、语义及隐层特…… -
-
开源全模态模型Baichuan-Omni-1.5上线,多项能力跑赢GPT-4o mini
百川智能上线开源全模态模型 Baichuan-Omni-1.5 。模型支持文本、图像、音频和视频的全模态理解,具备文本和音频的双模态生成能力。在视觉、语音及多模态流式…… -
字节跳动推出 OmniHuman 多模态框架:图片+音频 = 逼真动画
字节跳动提出 OmniHuman ,基于扩散变换器的高保真人类视频生成框架。模型通过单阶段的音频和姿态驱动,能生成高质量的人类视频内容。支持文本、音频、姿态等…… -
VideoWorld开源:多方合作打造仅靠视觉认知世界的视频生成模型
字节跳动豆包大模型团队联合北京交通大学、中国科学技术大学发布的“ VideoWorld ”视频生成模型,现已开源。模型首次实现仅通过视觉信息认知世界,无需依赖语言…… -
亚马逊年末甩王炸!6款大模型、3nm AI芯片、全球最大AI计算集群,苹果罕见站台
亚马逊在AWS re:Invent大会上宣布将推出6款大模型和3nm第三代AI训练芯片Trainum3,以及最强AI服务器Trn2 UltraServer。 Amazon Nova系列模型 涵盖文本、图像和…… -
智谱AI再放大招!全新多模态模型 GLM-4V-Flash 免费开放!
智谱AI推出首个免费多模态模型 GLM-4V-Flash ,该模型基于4V系列,提升图像处理精确度,降低开发门槛。模型支持26种语言,具备图像描述生成、分类等高级功能,…… -
全球首个”AI 程序员”Devin 全面开放:可独立开发/修复bug,月费500美元
全球首个AI程序员 Devin 已全面开放,支持个人开发者和团队以每月500美元订阅服务,包括Slack集成、IDE扩展和技术支持。Devin能熟练使用多种编程语言,独立完…… -
久等了,DeepSeek开源 DeepSeek-VL2 MoE视觉模型:支持动态分辨率、解析梗图等
DeepSeek推出 DeepSeek-VL2 AI视觉模型,模型采用DeepSeek-MoE架构结合动态切图技术,提升视觉能力。模型在视觉定位、梗图解析、OCR和故事生成等方面展现出新…… -
豆包大模型家族全面升级,重磅发布视觉理解模型
字节跳动旗下火山引擎发布豆包大模型家族全面升级,包括 视觉理解模型 ,能同时处理文本和图像问题,提供准确回答,大幅降低开发流程复杂度。模型在教育、旅游……

