AI资讯
-
Meta今年压轴开源 AI 大模型Llama 3.3,700亿参数,性能比肩4050亿
Meta发布AI大模型 Llama 3.3 ,拥有700亿参数,性能媲美4050亿参数的Llama 3.1。模型效率更高、成本更低,支持8种语言,可在标准工作站上运行。采用优化的tran…… -
MidJourney 上线 Patchwork:用户化身“造物主”,AI 构造故事宇宙
Midjourney推出 Patchwork 叙事工具,打造AI驱动的沉浸式故事世界。适用于小说作者、游戏开发者和艺术家等,用户在无限画布上构建角色、风格和背景故事。可以…… -
上新!阶跃星辰 Step-1o 千亿参数端到端语音大模型来啦!
阶跃星辰发布国内首个千亿参数端到端语音大模型 Step-1o 。模型支持语音和文本混合输入输出,具备高智商和情商,能理解语音背后的情绪信息,提供专业建议和情…… -
AI数据分析公司Databricks一口气融728亿!AI融资新纪录
AI数据分析公司Databricks宣布J轮融资目标为100亿美元(约合人民币728亿元),目前已完成86亿美元,超越OpenAI的65亿美元融资,创下全球AI创企融资新纪录。本…… -
支付宝「探一下」新一代AI视觉搜索产品,满足你的好奇心
支付宝推出新功能“ 探一下 ”,基于自研的多模态大模型技术,能够“用AI之眼探索万物”,提供快速、有用、趣味的生成式搜索服务。“探一下”提供三种核心服务:探知…… -
如何识别AI生成图片?腾讯上线「鉴别工具」
腾讯上线由腾讯混元安全团队朱雀实验室研发的 朱雀大模型检测 工具,旨在帮助用户识别AI生成的图像和AI生成文本检测系统。通过检测图片中的纹理、语义及隐层特…… -
-
开源全模态模型Baichuan-Omni-1.5上线,多项能力跑赢GPT-4o mini
百川智能上线开源全模态模型 Baichuan-Omni-1.5 。模型支持文本、图像、音频和视频的全模态理解,具备文本和音频的双模态生成能力。在视觉、语音及多模态流式…… -
字节跳动推出 OmniHuman 多模态框架:图片+音频 = 逼真动画
字节跳动提出 OmniHuman ,基于扩散变换器的高保真人类视频生成框架。模型通过单阶段的音频和姿态驱动,能生成高质量的人类视频内容。支持文本、音频、姿态等…… -
VideoWorld开源:多方合作打造仅靠视觉认知世界的视频生成模型
字节跳动豆包大模型团队联合北京交通大学、中国科学技术大学发布的“ VideoWorld ”视频生成模型,现已开源。模型首次实现仅通过视觉信息认知世界,无需依赖语言……