训练成本不到 50 美元,研究人员打造出媲美 OpenAI o1 的推理模型

斯坦福大学和华盛顿大学的研究人员仅花费不到50美元的云计算费用,训练出 s1 人工智能推理模型。模型在数学和编程能力测试中表现与OpenAI的o1和DeepSeek的r1等顶尖模型相当。s1通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中提取推理能力,使用监督微调方法,耗时不到30分钟。

版权声明:
作者:来吧来吧27
链接:https://deepseek-seo.net/%e8%ae%ad%e7%bb%83%e6%88%90%e6%9c%ac%e4%b8%8d%e5%88%b0-50-%e7%be%8e%e5%85%83%ef%bc%8c%e7%a0%94%e7%a9%b6%e4%ba%ba%e5%91%98%e6%89%93%e9%80%a0%e5%87%ba%e5%aa%b2%e7%be%8e-openai-o1-%e7%9a%84%e6%8e%a8-9/
来源:Deepseek SEO Hub
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>