最新文章
-
Hume AI 宣布推出新一代语音语言模型 OCTAVE,能检测微妙的情绪线索
Hume AI 推出新一代语音语言模型 OCTAVE ,模型融合了语言准确性和情感理解。OCTAVE结合了Hume AI的EVI 2语音语言模型、OpenAI的语音引擎、ElevenLab的TTS语音…… -
上海国资和腾讯联手投资,“大模型六虎”阶跃星辰获数亿美元B轮融资
AI大模型独角兽阶跃星辰完成数亿美元B轮融资,投资方包括上海国有资本投资有限公司、腾讯投资等。本轮融资将用于基础模型研发,强化多模态和复杂推理能力,扩…… -
OpenAI最强推理模型o3发布!AGI测试能力暴涨,最难数学测试分数碾压同行
OpenAI在第12天发布会直播上推出最强推理模型 o3 ,宣称接近通用人工智能(AGI)。o3在ARC-AGI测试中得分87.5%,远超GPT-3和GPT-4o。o3有完整版和mini版,mini…… -
国家电网发布国内首个千亿级多模态电力行业大模型
国家电网发布了国内首个千亿级多模态电力行业大模型“光明电力大模型”,模型参数规模达到千亿级别,具备电力知识记忆理解、多模态融合分析等能力,被誉为能源电…… -
影石发布AI双摄视频会议一体机Connect,让开会更简单
影石Insta360发布了智能双摄视频会议一体机 Insta360 Connect ,集成4K双摄、14阵列麦克风和扬声器,搭载AI算法,为6-14人中小型会议和教育场景提供解决方案。…… -
快手开源全球首个”多视角视频生成”工具,解锁无限视角!
快手开源全球首个”多视角视频生成”工具 SynCamMaster ,能从任意视点生成开放世界视频,解决了多视点间动态一致性问题。SynCamMaster通过即插即用模块增强预训…… -
Qwen开源视觉推理模型QVQ,像物理学家一样更睿智地看世界!
Qwen团队发布开源多模态推理模型 QVQ ,基于Qwen2-VL-72B构建,提升AI的视觉理解和复杂问题解决能力。QVQ在MMMU评测中得分70.3,显著优于Qwen2-VL-72B-Instruc…… -
星火浏览器插件新升级!能读会答、能翻译会总结
讯飞 星火浏览器插件 新升级,集成了讯飞星火V4.0底层能力,支持Chrome、Edge等主流浏览器。新增功能包括“继续提问”以深入讨论获取答案、网页全局对照翻译、一…… -
「像素绽放PixelBloom」完成国家队B2轮融资,打造全球AI办公软件超级工场
AIGC科技企业“像素绽放PixelBloom”完成B2轮融资,由北京市人工智能产业投资基金领投。融资将用于产品研发和市场拓展,旨在打造全球AI办公软件超级工场。旗下 A…… -
ElevenLabs推出Flash语音对话模型:仅75毫秒延迟,支持32种语言
ElevenLabs推出最新的人声合成模型 Flash ,宣称是目前最快的文本转语音解决方案,延迟仅为75毫秒,非常适合低延迟的对话式语音助手。Flash模型有两个版本,Fl……
友情链接