AI资讯
-
可图 1.5 图像模型来啦!全新「AI模特」功能上线
快手 可灵AI (Kling)团队发布可图1.5图像模型,模型在画面质量和美感上大幅提升。AI试衣新增“AI模特”功能,借助可灵1.6图生视频能力,用户只需输入文本描述…… -
豆包实时语音大模型上线即开放!情商智商双高
字节跳动旗下的豆包大模型团队宣布推出 豆包 实时语音大模型,在豆包APP全量开放。模型是语音理解和生成一体化的端到端语音系统,主要面向中文语境,支持英语…… -
Step-Video 开年震撼升级:更强大的真实世界模拟器来了
阶跃星辰推出视频生成模型 Step-Video V2 版本。新版本在参数量、语义理解、指令遵循能力等方面大幅提升,支持复杂运动、人物美感、基础文字生成和多语言输入…… -
可灵AI API新增【虚拟试穿V1.5】和【对口型】
快手 可灵AI (Kling)宣布API能力升级,推出虚拟试穿V1.5模型,支持单件及组合服装输入,能生成试衣视频。同时,新增对口型功能,可实现视频中人物口型与配音…… -
字节跳动推出全新AI IDE:Trae,基于Claude模型免费使用
字节跳动正式发布全新AI编程IDE—— Trae ,对标Cursor!支持原生中文,集成Claude 3.5、GPT-4o等顶级AI模型,免费开放使用。具备智能代码生成与优化、AI驱动的C…… -
字节跳动推出的开源原生 GUI 代理模型
字节跳动发布并开源了 UI-TARS 大模型,是专门用于操控电脑界面的视觉语言模型,具备感知、推理和操作能力。UI-TARS提供2B、7B和72B三种参数规模版本,支持跨…… -
谷歌前CEO施密特预测:AI 将在今年获得“永久记忆”,2028 美国会耗尽能源储备
谷歌前CEO埃里克·施密特预测,2025年AI将实现三大突破:获得“永久记忆”、智能体从对话到行动的飞跃、文本到行动的编程革命。他强调AI变革将“一切,无处不在,…… -
秘塔AI搜索上线“阅读模式”,PDF阅读体验全面升级
秘塔AI搜索 推出了全新的“阅读模式”功能。旨在解决PDF文档在移动设备上阅读不便的问题,支持复杂公式识别、智能渲染排版以及全文翻译,可轻松处理多列文字和图…… -
智谱GLM-PC开放体验:自主操作电脑的多模态Agent再升级
智谱推出电脑智能体 GLM-PC ,基于智谱CogAgent模型构建,能像人类一样“观察”和“操作”电脑,协助完成各类任务。新增“深度思考”模式、逻辑推理和代码生成功能,…… -
谷歌 DeepMind 推 CAT4D:普通视频变 3D 大片,单视角视频也能转换多视角了
谷歌 DeepMind 联合哥伦比亚大学和加州大学圣地亚哥分校开发了 CAT4D AI 系统,能够将普通视频转化为动态 3D 场景。系统基于扩散模型,将单视角视频转换为多视……

