hwyzw 发表于 2024-12-25 08:48:00

全球首个全自主AI软件工程师Devin:自主学习与编程能力详解

    文章目录

    德文是什么?

    Devin 是世界上第一位由 AI 初创公司开发的完全自主的 AI 软件工程师。他有能力独立学习新技术、端到端构建和部署应用程序、独立查找和修复代码错误以及训练和微调人工智能模型。在SWE-bench基准测试中,Devin展示了超越其他AI模型的性能,并正确解决了实际的编程问题。

    官方介绍视频:

    德文的主要特点

    德文拥有以下能力:

    https://img2.baidu.com/it/u=1685029381,2514553249&fm=253&fmt=JPEG&app=120&f=JPEG?w=669&h=500

    长期推理和规划:能够规划和执行需要数千个决策的复杂工程任务,记住每个步骤的相关上下文,随着时间的推移学习并修复错误。使用开发者工具:配备shell、代码编辑器、浏览器等常用开发者工具,在沙盒计算环境中工作。主动协作:能够实时报告进度、接受反馈并根据需要与用户一起做出设计选择。学习新技术:通过阅读博客文章和其他材料,了解如何使用不熟悉的技术。端到端应用程序构建和部署:能够从头开始构建和部署应用程序,例如 Sims of Life 游戏的交互式网站,并将其部署到。自行查找并修复代码库中的错误:帮助维护和调试开源竞赛编程书籍。训练和微调人工智能模型:只需提供研究存储库的链接即可对大型语言模型进行微调。处理开源存储库的问题:只需提供问题的链接,Devin 即可完成所有设置和上下文收集。对成熟生产存储库的贡献:作为 SWE-bench 基准测试的一部分,Devin 修复了 sympy 代数系统中的对数计算错误。做实际工作:在计算机上做实际的编程工作,编写和调试运行计算机视觉模型的代码,最后编译报告。

    德文的审核结果

    Devin 在 SWE-bench 上表现非常出色,这是一个具有挑战性的基准,要求参与者解决开源项目(例如 和 -learn)中的现实问题。 Devin 正确解决了 13.86% 的问题,这个速度远远超过了之前只能解决 1.96% 问题的现有技术水平。即使只给出要编辑的确切文件,之前最好的模型也只能解决 4.80% 的问题。 Devin 独立进行评估,而其他模型则得到协助(即模型被告知哪些文件需要编辑)。这一结果显示了 Devin 在理解和解决现实世界编程问题方面的巨大优势。

    如何使用德文?

    https://img1.baidu.com/it/u=3591025877,583210922&fm=253&fmt=JPEG&app=138&f=JPEG?w=596&h=500

    Devin现已开放使用,Devin官网地址:

    热门AI工具推荐:
页: [1]
查看完整版本: 全球首个全自主AI软件工程师Devin:自主学习与编程能力详解