AI资讯
-
ElevenLabs推出Flash语音对话模型:仅75毫秒延迟,支持32种语言
ElevenLabs推出最新的人声合成模型 Flash ,宣称是目前最快的文本转语音解决方案,延迟仅为75毫秒,非常适合低延迟的对话式语音助手。Flash模型有两个版本,Fl…… -
用AI大模型重塑服装设计制版,「深服科技」获数千万元Pre-A轮融资
浙江深服人工智能近日完成数千万元Pre-A轮融资,由上海厚毅资本领投。资金将用于模型开发、技术人才引进和市场拓展。深服科技成立于2023年,专注于为服装行业…… -
微信公众号后台新增“AI 配图”功能,支持文章配图和封面配图
微信公众号后台最近推出了“AI 配图”功能,支持创作者通过简单的文字描述在十几秒内生成四张风格和比例可调的候选图片,用于文章配图。极大提高了内容创作的效…… -
Kimi 发布 k1 视觉思考模型,多项理科测试行业领先
月之暗面 Kimi 今日发布 k1 视觉思考模型 ,模型基于强化学习技术,支持端到端图像理解和思维链技术,覆盖数学、物理、化学等基础科学领域。k1模型在多项基准…… -
微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GPT-4o Mini
微软2025年1月8日在Hugging Face平台开源了小语言AI模型 Phi-4 ,其参数量为140亿。Phi-4在多个基准测试中表现优异,超越了参数量更大的Llama 3.3 70B和OpenAI…… -
对话智谱CEO张鹏:大家对大模型期待过高,Scaling Law还有很大增长空间
CEO张鹏认为,大家对大模型期待过高,但Scaling Law仍有增长空间。智谱AI定位“开放平台”,聚焦基座模型研发,已获九轮融资近60亿元,致力于AI智能体应用,推动…… -
即梦2.1模型上线,一键生成图文融合设计图
字节 即梦AI 发布全新绘图模型v2.1,10秒内一键生成中文海报。解决了中文嵌入问题,支持直接在图片上绘制中英文字体,具有高审美和泛化能力。可通过简单描述生…… -
刚刚!字节跳动豆包上线图片理解,大模型走向多模态
字节跳动 豆包 APP和PC端新增图片理解功能,能识别图片内容并回答相关问题,如景点位置和动漫人物身份。标志着AI大模型向多模态发展,更加实用。豆包已成为中…… -
快手可灵 1.6 模型发布:文本响应度、画面美感及运动合理性均有“明显提升”
可灵 近日推出了1.6版本,实现了图生视频的巨大飞跃。更新重点包括物理规律真实感、人物运动表演和语义理解的大幅提升。新版本在切食物、倒茶、跳舞等动作的物…… -
星火浏览器插件新升级!能读会答、能翻译会总结
讯飞 星火浏览器插件 新升级,集成了讯飞星火V4.0底层能力,支持Chrome、Edge等主流浏览器。新增功能包括“继续提问”以深入讨论获取答案、网页全局对照翻译、一……

