OpenAI 推出大模型测试基准 SWE-Lancer

来吧来吧27 • 2025年2月25日 am12:00 • AI资讯

OpenAI 官方宣布，推出全新的大模型测试基准 SWE-Lancer ，用于评估大语言模型（LLMs）在自由职业软件工程任务中表现的基准测试。基准包含来自 Upwork 的 1400 多个真实任务，总价值达 100 万美元，涵盖从简单修复到复杂功能开发的全栈工程任务。

版权声明：
作者：来吧来吧27
链接：https://deepseek-seo.net/openai-%e6%8e%a8%e5%87%ba%e5%a4%a7%e6%a8%a1%e5%9e%8b%e6%b5%8b%e8%af%95%e5%9f%ba%e5%87%86-swe-lancer-3/
来源：Deepseek SEO Hub
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

下一篇>>