Claude

3月19

  • AI程序员代码能力超Claude 2

    00:33 作者:Po

    3月15日,AI创企Cognition对其团队发布的首个AI软件工程师Devin进行了技术解读,发布了关于Devin的SWE-bench基准测试技术报告。SWE-bench可以评估系统解决现实中代码库问题的能力。测试结果显示,Devin不需要人类辅助就可以解决570个问题中的79个问题,成功率为13.86%,高于SOTA 大模型(Claude 2)的4.80%。

    Claude
    分享到

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索
error: 您点击的内容受到保护~