数字技术与基础设施

美Cognition推出首位“人工智能软件工程师”

日期:2024-04-30

|  来源:【字号:

2024312日,美国Cognition公司推出了一款名为Devin的人工智能(AI)助手,可协助人类软件工程师完成诸多开发任务。Devin不同于现有其他AI编码者,它可从零构建网站、自行部署应用、修复漏洞、学习新技术等,人类只需扮演一个下指令和监督的角色。这是第一个真正意义上完全自主的“AI软件工程师”。

Cognition官网报道,Devin只需一句指令,即可端到端地处理整个开发项目。按照用户需求,Devin可同时执行多步骤工作流程,人类工程师则可实时观察其进度,发现错误时,跳出指令进行修正。这便于工程师们将大部分工作“外包”给AI,自己则可潜心于创意性工作。

此外,作为一个AI全能助手,Devin还可帮助人类训练和微调其他AI。对于一些常见的模型,人们只需要提及模型的名称,Devin就知道要怎样去训练。

SWE-bench基准测试中,Devin的表现远超Claude 2LlamaGPT-4等选手,能完整正确地处理13.86%的问题。相较之下,GPT-4只能处理1.74%的问题。更重要的是,Devin在测试中没有得到任何帮助,而其他所有模型都需要帮助,即人们要准确告知模型需要编辑的文件。

信息来源:

https://www.cognition-labs.com/introducing-devin

http://digitalpaper.stdaily.com/http_www.kjrb.com/kjrb/html/2024-03/15/content_568615.htm?div=-1


附件: