AI资讯
-
谷歌版Sora迎来 Veo 2,升级4K高清!一句话控制镜头运动,Imagen 3 再进化
谷歌版Sora升级至 Veo 2.0 ,能根据文本或图像生成4K高清视频,理解镜头控制指令。在模拟现实物理和人类表情方面有显著提升,能精确遵循复杂的指令Prompt。在M…… -
Hume AI 宣布推出新一代语音语言模型 OCTAVE,能检测微妙的情绪线索
Hume AI 推出新一代语音语言模型 OCTAVE ,模型融合了语言准确性和情感理解。OCTAVE结合了Hume AI的EVI 2语音语言模型、OpenAI的语音引擎、ElevenLab的TTS语音…… -
微信公众号新增“作者朗读音色”功能:可生成作者音色全文音频
微信近日推出了“作者朗读音色”新功能,支持用户在阅读公众号文章时通过点击“听全文”来收听作者音色朗读的文章。作者需在“公众号助手”App中录制例句以复刻语气…… -
全网热评的李飞飞世界生成模型,真的能构建物理世界吗?
李飞飞的空间智能World Labs发布了世界生成模型,一个能从单张图片生成3D物理世界的AI系统,引起AI界热议。该技术突破在于直接生成三维场景,遵循物理规则,具…… -
全球首个”AI 程序员”Devin 全面开放:可独立开发/修复bug,月费500美元
全球首个AI程序员 Devin 已全面开放,支持个人开发者和团队以每月500美元订阅服务,包括Slack集成、IDE扩展和技术支持。Devin能熟练使用多种编程语言,独立完…… -
OpenAI 推出 Projects,功能全家桶打造 ChatGPT 新交互方式,迈向“万能应用”
OpenAI在“OpenAI 12天”活动第7天推出了ChatGPT的新功能 Projects ,功能支持用户上传文件、自定义指令、分组聊天和数据管理,整合Canvas和ChatGPT Search,提…… -
腾讯微信正式发布多模态大模型 POINTS 1.5,10B参数下开源模型排名第一
腾讯发布多模态大模型 POINTS 1.5 ,继承了POINTS 1.0的LLaVA架构,包含视觉编码器、投影器和大语言模型。模型在效率和性能上均有显著提升,特别是在复杂场景O…… -
红杉美国最新洞察:2025 年将是 Agent 元年!AI 智能体进入“群体协作”时代
红杉美国合伙人Konstantine Buhler预测,2025年 AI智能体 将进入“群体协作”时代,多个智能体网络将协作完成复杂任务。他强调,AI技术将在医疗和教育领域发挥重…… -
谷歌领跑AI视频生成赛道:抢先 OpenAI Sora推出Veo模型,可生成1080P高清视频
谷歌宣布在Vertex AI平台上推出 Veo 模型的私测预览版,面向企业开放。Veo模型能根据文本或图像提示生成1080p高清视频,提供多种视觉风格。Veo生成的视频逼真…… -
豆包大模型团队开源FullStack Bench代码全新基准,覆盖超11类真实编程场景
字节跳动豆包大模型团队开源全栈编程代码评估数据集 FullStack Bench 。FullStack Bench覆盖超11类真实编程场景和16种编程语言,包含3374个问题,有效评估大模……