机器之心报道
机器之心编辑部
前段时间,英伟达CEO黄院士发出惊人言论:「都别学编程了,以后交给AI就行了,以后人人都是软件工程师。」当时还有很多人反对,说「AI永远不会取代程序员。」没想到,首个人工智能软件工程师Devin一发布,程序员的饭碗可能真要被AI端走了。
在SWE-Bench基础测试中,无需人类协助,Devin就可以解决13.86%的问题。而目前的SOTA模型,在没有人类帮忙的情况下,只能完成1.96%的任务。
仅从评测结果看,Devin解决真实世界软件问题的能力要远好于当前的GPT-4和Claude等模型。
官方发的推特说,Devin不仅通过了一家业内领先的人工智能公司的面试,在自由职业平台Upwork上也能成功接单,完成单主要求的工作。也就是说,Devin不仅是横扫基础测试的「做题家」,在就业市场里也有人为它的工作能力买账。
难道继Sora让「现实世界」不存在了之后,Devin也要让「软件工程」不存在了吗?
Devin现在还未对外开放,但已经有开发人员和产品人员用上了。测试过的网友表示,以前一直用人工智能辅助编码,但一直失败。直到昨天,他给Devin了一个简单的HTML页面,让它提取选择器,这个GPT-4-turbo、Claude、Groq、LLama2都没完成的任务,Devin只用了大约10秒就搞定了。
源自