首个AI软件工程师震撼硅谷!
一觉醒来,程序员怕是真要失业了。
首个AI软件工程师一亮相,直接引爆整个科技圈。只需一句指令,它可端到端地处理整个开发项目。
在SWE-bench基准测试中,它无需人类帮助,可解决13.86%的问题。
相比之下,GPT-4只能处理1.74%的问题,且都需要人类提示告知处理哪些文件。
可以说,它远远超过了此前所有AI大模型。
从零构建网站、自主查找并修复Bug、甚至是训练和微调自己的AI模型通通都不在话下~也可为一些成熟的代码库做贡献。
就是一些不熟悉的技术,给它看一篇博客文章。它也能立马搞定。
比如用ControlNet,生成带有隐藏文字的图像,Devin就是一点就通~
Devin被介绍为世界首个完全自主的AI软件工程师。
它在长程推理和规划上面下了很大功夫,可以规划和执行需要数千个决策才能完成的复杂软件工程任务。
在这之中,进行到任何一步它都可以回调所有相关的上下文信息,保证整体逻辑性,并方便随时校正错误。
既然是一个端到端AI,软件开发人员常用的工具,比如shell、代码编辑器和浏览器等等,Devin也都配备(沙盒计算环境中),主打一个全方位服务。
最终的Devin,让人类只需要发号施令,其他什么也不用做。
具体来看,其主要能力有以下六个:
1、端到端构建和部署程序;
2、自主查找并修复bug;
3、训练和微调自己的AI模型;
4、修复开源库;
5、成熟的生产库也能做贡献;
6、不熟的技术,现学现卖。
文章来自网络