AI资讯
-
微信公众号新增“作者朗读音色”功能:可生成作者音色全文音频
微信近日推出了“作者朗读音色”新功能,支持用户在阅读公众号文章时通过点击“听全文”来收听作者音色朗读的文章。作者需在“公众号助手”App中录制例句以复刻语气…… -
「像素绽放PixelBloom」完成国家队B2轮融资,打造全球AI办公软件超级工场
AIGC科技企业“像素绽放PixelBloom”完成B2轮融资,由北京市人工智能产业投资基金领投。融资将用于产品研发和市场拓展,旨在打造全球AI办公软件超级工场。旗下 A…… -
智谱AI 开源 GLM-PC 基座模型 CogAgent-9B,推动GUI交互自动化技术
智谱AI宣布开源GLM-PC基座模型 CogAgent-9B ,是基于GLM-4V-9B训练的专用Agent任务模型,能仅通过屏幕截图预测GUI操作。CogAgent-9B在GUI感知、推理预测准确性…… -
可灵AI API新增【虚拟试穿V1.5】和【对口型】
快手 可灵AI (Kling)宣布API能力升级,推出虚拟试穿V1.5模型,支持单件及组合服装输入,能生成试衣视频。同时,新增对口型功能,可实现视频中人物口型与配音…… -
Qwen开源视觉推理模型QVQ,像物理学家一样更睿智地看世界!
Qwen团队发布开源多模态推理模型 QVQ ,基于Qwen2-VL-72B构建,提升AI的视觉理解和复杂问题解决能力。QVQ在MMMU评测中得分70.3,显著优于Qwen2-VL-72B-Instruc…… -
阶跃星辰语言模型上新:既有文学大师,又有性价比之王
上海阶跃星辰推出Step系列语言模型的两位新成员: Step-2 mini 和Step-2文学大师版。Step-2 mini是轻量级模型,仅用3%的参数量保留了Step-2模型80%以上的性能…… -
Perplexity发布Sonar API,提供实时信息搜索功能
Perplexity发布 Sonar API,提供实时信息搜索功能。Sonar API分为基础版和Pro版,基础版支持轻量级实时搜索和简单查询引用,Pro版则支持复杂多步骤任务、更大…… -
OpenAI发布新的推理模型o3-mini,性能提升 24%
OpenAI发布新的推理模型 o3-mini ,是推理系列中最具成本效益的模型。o3-mini在科学、数学和编程等STEM领域表现出色,保持低延迟和低成本。支持函数调用、结构…… -
可图 1.5 图像模型来啦!全新「AI模特」功能上线
快手 可灵AI (Kling)团队发布可图1.5图像模型,模型在画面质量和美感上大幅提升。AI试衣新增“AI模特”功能,借助可灵1.6图生视频能力,用户只需输入文本描述…… -
豆包实时语音大模型上线即开放!情商智商双高
字节跳动旗下的豆包大模型团队宣布推出 豆包 实时语音大模型,在豆包APP全量开放。模型是语音理解和生成一体化的端到端语音系统,主要面向中文语境,支持英语……