全球第一位AI软件工程师Devin被指造假 !虚假宣传加制造焦虑「人类软件工程师不可取代」



2024年3月,Cognition AI公司认知实验室(Cognition Labs)推出了全球首位全自主人工智能软件工程师——Devin,并且成功融资2100万美金
Cognition AI声称,Devin 可以在几分钟内独立完成整个软件项目,能够进行复杂的多步骤推理,即使执行了数千项任务也不会出错
现在Devin被博主Internet of Bugs指控造假:

Devin 号称能像一个真正的软件工程师一样去 upwork(一个外包平台) 接活,但实际上,Devin 并不能按照雇主的要求去完成完整的任务,一方面 Devin 只是挑选了需求的一部分去完成,另一方面 Devin 并不能像一个真正的工程师一样,跟雇主去提方案,确认需求! 

具体来说所谓的 "全球首位人工智能软件工程师 "Devin 横空出世,该公司撒谎说,他们的视频展示了 Devin 在 Upwork 上完成自由职业工作并获得报酬的过程,但根本就没这回事
这哥们对 Devin Upwork 的视频进行了逐帧分析,作者花了 36 分钟将 Devin 视频中的 upwork 任务完成了一遍,展示了 Devin 应该做什么,它实际上做了什么,以及它做得有多糟糕。整个揭穿过程极其有力、令人信服,主要内容如下:
Devin被宣传为能够解决任意Upwork任务。但在视频演示中,所解决的问题与客户提出的要求(要求的是安装说明,而不是代码)并不吻合

‍‍
视频中展示了Devin修复GitHub仓库源代码中的错误,但它编辑的文件实际上并不存在于该仓库中,而且它修复的一些错误是毫无意义的,不是人类会犯的错误。这暗示Devin可能是在修复自己创建的文件中的错误,但这并没有得到明确说明

‍‍
根本没有必要进行任何编码,因为该仓库中的README文件已经包含了完成该任务所需的所有说明,只需要做一个简单的一行修改就可以正常运行,尽管该仓库已经很旧了。这就是为什么客户要求提供在EC2上运行的说明,而不是编码。Devin似乎并没有阅读README文件,也没有意识到只需要执行几个预先存在的Python脚本即可。视频中显示的输出让人觉得这个任务很复杂和sophisticated,有很长的计划和许多已完成的检查点,但实际上这些工作是毫无意义和多余的

‍‍
Devin的代码修改是糟糕的,比如编写自己的低级文件读取循环,而没有正确使用标准库

‍‍
尽管视频让人觉得Devin很快就完成了任务,视频创作者也在大约30分钟内完成了所要求的任务,但聊天记录中的时间戳显示任务持续了很多小时,甚至延续到第二天

‍‍
Devin进行了一些毫无意义的shell命令,如"head -n 5 foo | tail -n 5"。
结语
devin刚出来时,铺天盖地的宣传的确制造了很多焦虑,这让很多非技术人员相信,人工智能可能很快就会取代程序员‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍
按照博主Internet of Bugs的话:“软件开发者的工作中一部分,那些 AI 做不好的部分。难点、关键、复杂、耗时的部分主要是与客户、上司及其他利益相关者的沟通。弄清楚到底需要处理什么,反复讨论,说:"这么做会简单很多,我们就这么做如何?"这些都是 AI 目前无法完成的任务,而这些恰恰是我们所做的非常重要的事情。”
很想知道Devin团队会如何回应?Internet of Bugs博主说他并不针对Cognition AI upwork演示的工程师,也不针对开发devin的工程师,他只是针对Cognition AI 公司的宣传手段,目前人工智能有太多的炒作
⭐星标AI寒武纪,好内容不错过⭐
用你的赞和在看告诉我~

别焦虑👇👇
到顶部