一个来自中国创业者 L5 自主编程能力的探索

查看 83|回复 9
作者:yafeilee   
大家好,我是 ShowMeBug 的创始人亚飞,全栈工程师,连续创业者。今天非常高兴跟大家介绍一下,我们自主研发的、带有 L5 自主编程能力的 1024Code 云端开发平台和进展情况,目前我们已经启动了公测邀请。
1024Code 云端开发平台介绍视频: https://www.bilibili.com/video/BV1YF4m1c7rH/?share_source=copy_web&vd_source=9bb16af47f4ff115bffa964190f6fa4b
1024Code 的核心能力
1024Code 是采用 1024PaaS (全栈自研的云端编程环境)为核心,通用大模型为基座,花费了 10 多个月构建一套自主决策链 AI Agent (目前称为 AI 导师),提供了编程环境感知,代码编辑,Shell 、Console 的自阅读,运行与自主 Debug 。
简单来说,就是将 AI Agent 安装了手与脚,让其自主完成需求分析到编码调试的过程。

1024Code 尝试定义 AI 与人类编程交互的新方式
在当前阶段,1024Code 更相信人类的代码,所以 AI 在修改人类代码时需要人类确认,AI 在修改自己的代码时可以立刻生效。
得益于我们全栈自研的技术,我们的团队能够深度定义编辑器的内核,实现快编辑的能力,能够准确区分代码是来自 AI 生成还是人类编写。

具体能力介绍
从零开发一个小项目
1024Code 可以根据你的需求介绍,进行 MVP (最小可行版本)拆解需求,然后实现第一版 MVP 。它可以实现一个小型项目(至多不超过 10 个)多个文件的生成和编辑。

解决一个小的需求
你提出需求,1024Code 的 AI 导师会首先自行感悟编程环境(例如是哪个语言哪个框架),然后分析需求(如遇需求不清楚时会自行跟你互动),构建代码语义树,确定需要创建新的文件或者修改哪些文件,生成对应代码,利用 1024PaaS 提供的更新代码块能力进行逐字处理。最后尝试运行代码并检查控制台输出,完成本次需求实现。
自动 Debug 错误
发现控制台的错误时,它会自行开始 Debug 调试错误。读取报错信息并决定如何修复,然后读取对应代码进行修改。
与人类在代码归属上创新互动
AI 导师可以直接修改它自己之前完成的代码,修改人类代码需要一个确认与 diff 比较的过程。
1024Code 中 AI 导师的能力限制
AI 导师在 1024Code 中是一个完全拟人的存在,它有自己独立的交互界面,甚至人类可以直接观察它的每一步操作。由于当前大模型的智能还不足够,我们看一下能力上的限制。

决策能力上的限制
目前超出 10 个文件的较大项目表现会出现成功率大幅下降的情况。
在网页项目、命令行项目、Python 游戏外的项目,目前没有针对优化。
浏览器眼睛视觉还未添加
在更理想的情况下,AI 导师应该能主动识别浏览器网页上的界面错误,并进行修复,但这个依赖于现有大模型的多模态能力与 Token 成本,目前还未实现相关能力。
未来的展望
未来的编程世界将发生重大范式变化,云端编程+原生 AI 编程将彻底改变传统本地开发方式,就如同文档在线化置于本地编辑,Figma 置于 PS ,网盘置于本地 USB 存储。80% 的代码由 AI 完成,人类完成剩下的架构工作是接下来 AI 时代相当长时间持续的一种新的编程常态。
具体案例
同事跑了几个项目,大家可以点击视频链接了解:
[ol]

  • 尝试使用 1024Code 的 Agent 智能体功能修复 Chart.js 里一个 Bug
    https://www.bilibili.com/video/BV1Lj421f7UK/?share_source=copy_web&vd_source=9bb16af47f4ff115bffa964190f6fa4b

  • 使用 Agent 智能体功能补全&迭代音乐播放器项目代码
    https://www.bilibili.com/video/BV1uK421v74Z/?share_source=copy_web&vd_source=9bb16af47f4ff115bffa964190f6fa4b

  • 国内也有 Devin 了?一句话需求生成 2048 游戏!
    https://www.bilibili.com/video/BV1m2421N7eN/?share_source=copy_web&vd_source=9bb16af47f4ff115bffa964190f6fa4b
    [/ol]
    我们已经发布邀请码公测
    1024Code 目前已经启动了邀请码公测,大家可以通过朋友或者主动申请获取邀请码来体验和使用产品,目前整个产品完全免费,AI Agent 的体验使用是积分消耗模式。

    如果你在商业、投资或大模型能力上想与 1024Code 合作可以直接加创始人微信号:lyfi2003
    让我们一起打造下一代全新 L5 全自主编程新范式吧!
  • kkk9   
    李彥宏 2.0😅
    rina   
    赞一个
    qsgy123456   
    AI 做自动化软件测试效果会不会更好一点?我写了代码,但是不知道哪里有问题,AI 自己搞测试案例,自动测试,或者使用软件测试。
    单元测试让 AI 来做,感觉有戏。
    amon   
    很好的尝试,看了音乐播放器和修改 Chartjs issue 的视频,感觉交互上挺完善。
    不过目前还是偏玩具性质,距离工业级应用不知道有多远。
    Rrrrrr   
    自主模型?
    yafeilee
    OP
      
    @Rrrrrr 用的通用大模型底座,上面自己研发的决策链 agent
    yafeilee
    OP
      
    @kkk9 😂,不管怎么样,李彦宏还是更有成就。希望他少吹点😅
    matrix1010   
    Devin 我估计不太可能被墙,就看他们想不想做国内。如果到时候发布而且国内能用的话 op 这个就比较危险了,很有可能被 ioi 金牌团队降维打击
    paopjian   
    用你们的能力评测已经怀疑人生了
    您需要登录后才可以回帖 登录 | 立即注册

    返回顶部