美Cognition推出首位“人工智能软件工程师”
| 来源:【字号:大 中 小】
2024年3月12日,美国Cognition公司推出了一款名为Devin的人工智能(AI)助手,可协助人类软件工程师完成诸多开发任务。Devin不同于现有其他AI编码者,它可从零构建网站、自行部署应用、修复漏洞、学习新技术等,人类只需扮演一个下指令和监督的角色。这是第一个真正意义上完全自主的“AI软件工程师”。
据Cognition官网报道,Devin只需一句指令,即可端到端地处理整个开发项目。按照用户需求,Devin可同时执行多步骤工作流程,人类工程师则可实时观察其进度,发现错误时,跳出指令进行修正。这便于工程师们将大部分工作“外包”给AI,自己则可潜心于创意性工作。
此外,作为一个AI全能助手,Devin还可帮助人类训练和微调其他AI。对于一些常见的模型,人们只需要提及模型的名称,Devin就知道要怎样去训练。
在SWE-bench基准测试中,Devin的表现远超Claude 2、Llama、GPT-4等选手,能完整正确地处理13.86%的问题。相较之下,GPT-4只能处理1.74%的问题。更重要的是,Devin在测试中没有得到任何帮助,而其他所有模型都需要帮助,即人们要准确告知模型需要编辑的文件。
信息来源:
https://www.cognition-labs.com/introducing-devin
http://digitalpaper.stdaily.com/http_www.kjrb.com/kjrb/html/2024-03/15/content_568615.htm?div=-1