site stats
昨晚普林斯顿大学开源了一个类似AI 程序员Devin的项目 SWE-agent。SWE-agent 将 LM(例如 GPT-4)转变为软件工程代理,可以修复真实 GitHub 存储库中的错误和问题。在完整的SWE-bench测试集上 SWE-agent 12.3 分只差了Devin一分Claude3 opus只有 3 分多。SWE-agent的一些特点:✲…
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多