AI资讯
-
ElevenLabs推出Flash语音对话模型:仅75毫秒延迟,支持32种语言
ElevenLabs推出最新的人声合成模型 Flash ,宣称是目前最快的文本转语音解决方案,延迟仅为75毫秒,非常适合低延迟的对话式语音助手。Flash模型有两个版本,Fl…… -
IBM 发布新语言模型 Granite 3.1,性能、上下文能力增强
IBM发布大语言模型新版本 Granite 3.1 ,相较于3.0版本,Granite 3.1采用了更密集的架构,能处理多达128,000个令牌,显著提升了处理复杂文本的能力。版本包含8…… -
PixVerse V3.5 正式上线,模型全面升级,10秒极速生成
爱诗科技宣布 PixVerse V3.5 版本正式上线,新版本在Turbo模式下10秒内即可生成高质量视频,保持行业领先的语义理解和细节表现力。动漫生成效果显著提升,支持…… -
微软发布新模型 LAM ,可以自己操作Windows程序
微软推出 LAM (Large Action Model)“大型动作模型” ,能够独立操作Windows程序,将用户请求转化为实际行动。是首个专门训练与微软Office产品一起工作的模型…… -
科大讯飞2025年「首场发布会」,打造每个人的办公新范式
科大讯飞于2025年1月7日在北京中关村国际会议中心举办办公智能体产品升级发布会,推出多款升级产品。此次升级围绕智慧办公新范式,首次联合发布“知识中台、AI…… -
海螺AI推出全新 S2V-01 主体参考模型,AI视频创作再上新台阶
海螺AI 推出全新S2V-01主体参考模型,支持用户通过上传一张参考图片,生成与原图高度一致的角色视频。显著提升AI视频创作的效率和质量,使得每一帧画面都能完…… -
Vidu 2.0全新升级,更快、更强、更稳定
Vidu 2.0正式上线,带来生成速度与画质的双重突破,10秒即可出片。效果升级,视频风格、主体更一致,首尾帧更自然。推出超值套餐,成本低至4分/秒。新增错峰模…… -
香港大学携手快手科技推出 GameFactory 框架,突破游戏场景泛化难题
香港大学与快手科技联合推出 GameFactory 框架,旨在解决游戏视频生成中的场景泛化难题。框架基于在开放域视频数据上预训练的视频扩散模型,可生成多样化游戏…… -
豆包大模型1.5正式发布,全面上线火山方舟
字节跳动旗下火山引擎正式发布 豆包大模型1.5 Pro 。模型在知识、代码、推理、中文等多个权威测评基准上表现优异,综合得分超越GPT-4o、Claude 3.5 Sonnet等业…… -
通义开源两大AI模型:支持理解长视频和捕捉事件等能力
通义开源两大AI模型: Qwen2.5-VL 和 Qwen2.5-1M 。Qwen2.5-VL推出3B、7B和72B三个版本,全面超越GPT-4o与Claude3.5。模型支持超1小时的视频理解,无需微调即……

