AI程序员代码能力超Claude 2

Claude
3月19日

Po山鲸AI官方编辑

3月15日，AI创企Cognition对其团队发布的首个AI软件工程师Devin进行了技术解读，发布了关于Devin的SWE-bench基准测试技术报告。SWE-bench可以评估系统解决现实中代码库问题的能力。测试结果显示，Devin不需要人类辅助就可以解决570个问题中的79个问题，成功率为13.86%，高于SOTA 大模型（Claude 2）的4.80%。

赞同　

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

Apple ID 美国，已购Shadowrocket火箭，独享账号！

￥ 68.88
Sora 2 / ChatGPT 索拉 2 官方邀请码，自动发货，免费赠送去水印教程

￥ 7.77
Google/Gmail 邮箱账号，绝版靓号，7位纯数字/不带4，可自选账号！

￥ 88.88
Apple ID 英国，独享账号

￥ 18.88
Google/Gmail 邮箱账号，稳定可用

￥ 39.99
Apple ID 美国，独享账号

￥ 18.88

❯

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
山鲸AI丶鲸喜官

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部

error: 您点击的内容受到保护~