做了个 Excel Agent 的 exe 程序

查看 12|回复 0
作者:w775495797   
背景
半年前,我司有一个巨大无比的,100 字段+ 70 万行数据的 excel ,给总部的业务部门同事使用
恰逢我所在的组有时间,严格来说就是我有时间
先开发了相关的 MCP Server
后发现 总不能让同事们使用 Cherry studio 来进行问答吧
单独使用 dify 又感觉对 agent 支持的不是很好  
于是乎就开始开发了 MCP client  
先是对接 openai 的 sdk ,毕竟通用一些,各个厂商都兼容
然后定前后端的交互标准,决定 websocket
然后做着做着,我发现,我不止需要一个 Agent ,我还得多个 Agent 配合
最后愣是从一个需求,变成手搓 Agent 框架
也考虑过 LangChain 或者 LangGraph 、AutoGen 等等很多框架
但是都不是很自由,因为我司用 LangChain 搭建的知识库问答系统,所以决定自己手搓吧
然后在业务上
将 excel 转到 sqlite ,再用 llm 进行 text2sql  
项目算是上线了,这算是背景
当然啊,其实我从一开始就不打算弄 excel ,我做的是从 mysql 数据库同步数据库到我的 sqlite 子库
毕竟主库不能随意修改,我这个子库只读的,分析的话就足够了,不然哪天不长眼的同事来一句,把数据都删了,麻烦就大了  
Excel 后续
这个事情完毕后呢,我偶尔抬抬头
发现,其实业务部门不止有这一个业务
几乎财务、库管、综合部、销售部等等,人人都在对着 Excel 办公
我心想的是,不如玩大一点
做一个通用点的东西  
所以我抛弃了 MCP,不考虑一切增加用户麻烦的操作
最终直接做出来一个 EXE 程序,牛马不难为牛马
https://github.com/QingHeYang/KELA-Agents
技术栈大概就是,python+vue+electron  
项目原理:  
[ol]
  • excel 扔进来,理解表头,分析列数据
  • 二维化,根据表头制作 sql table
  • 导入全部数据进入数据库
  • 自然语言问答  
    [/ol]
    相当于把一个 OR 多个 Excel 给做成了一个业务系统的数据库  
    这个项目擅长的操作有:  
  • 聚合分析,毕竟相当于 excel 导入成了数据库,自然语言  
  • 擅长大量的数据,但是导入的时候要消耗内存,40w+数据,实测导入的时候 2GB 内存,导入后就不需要了  
  • 把查询的数据转出 Excel ,让 llm 制作 excel ,筛选的 excel 都能导出,我做了相关的工具  
  • 使用 Echarts 做图表,8 种吧,也算是工具
  • 数据溯源,llm 查询的数据,多于 15 行的,可以点击查看
  • 生成的东西保存历史,反正我描述不太清,一堆乱七八糟的功能

    截图在这里: https://github.com/QingHeYang/KELA-Agents/blob/main/docs/zh/screenshots.md
    不擅长的操作有
    他不是操作 excel ,各位大佬们应该懂这个,所以:  
  • 调整不了格式  
  • 无法新增数据,你让 llm 新增则另说  
  • 什么样式什么的都无法调整
  • 预设的什么公式基本算是没有
  • 大致意思就是,office 擅长的,他都不擅长  

    所以算是一个偏科生吧,擅长应付特别大的数据
    毕竟现有的很多 agent 都是使用 pandas 操作 excel ,数据量一大,上下文撑不住  
    哦对了,一个大优势:
    使用用户自己的 api key 操作,也就是说,按需使用吧
    数据留存在本地,除了 llm 查看的那部分,他只能查看少量样本数据
    鄙人不会收集任何用户隐私与 excel 的表格、问答业务数据,对我没啥用,
    我就想要 github 的 star ,到时候万一被裁了,也好找下家说,我做了什么东西,哈哈哈  
    感兴趣的朋友可以看一看,不感兴趣的就当看了篇无聊的文章了  
    下载在 release 里面: https://github.com/QingHeYang/KELA-Agents/releases/tag/v1.0.0
    安装不需要配置什么环境变量,不需要安装什么复杂的框架
    就是安装包,我想给绿色包来着,但是死活上传不上去,也不知道为什么
    存储桶的话,我掏不起那个 CDN 的钱,有什么便宜点的分发平台么?
    当然,我肯定用了大量的 ai 编程,我自己一个人又不是神仙,哈哈哈哈
  • 您需要登录后才可以回帖 登录 | 立即注册

    返回顶部