ai-diving:让 LLM 替我盯着 Docker 镜像"是不是又胖了"

查看 7|回复 0
作者:treexie   
起因
以前使用wagoodman/dive分析镜像优化空间,每次生成镜像之后自己执行命令过于麻烦,后来就diving-rs可以通过 webhook 的形式触发分析,再记录到数据库中定期分析。
但用着用着发现两件事:
1 、需要人工参与的工作一直都会滞后,甚于变成了形式工程(只记录无人分析)
2 、每个人对标准不一致,也没有统一的数据作为指标,最终也无法保证规则得到有效执行
刚好赶上小米开放百万亿 token 的免费额度,懒人福音。把"人盯报告"换成"AI 盯报告":每次新 push ,把这次的 diving 报告 + 上次成功的 LLM
结论一起喂给模型,让它做对比分析。
系统 prompt 写得比较简单(后续提供自定义),核心几条:

  • 表现良好的指标(体积减小、浪费率 0%、非 root )禁止提及,不要废话
  • 体积劣化必须穿透到具体 Layer + 具体文件,精确到 MB
  • OverlayFS 穿透判定:基础镜像的固化冗余禁止建议跨层 RUN rm -rf(那只会让镜像更大),只建议换基底
  • 新增 COPY/ADD 文件 owner 是否与 USER 倒挂


    加上"无异常就回一句健康通过;有异常就只说问题 + 改哪几行"的硬约束,输出基本没什么水分。
    流程
    Docker Hub Webhook --> ai-diving (入队 + dedupe) --> cron 每分钟抢一批 WAITING
    diving-rs (拉镜像 / 出 markdown) + 上次成功的 LLM --> 优化建议 markdown --> 企业微信机器人 / Resend 邮件
    输出长啥样
    完成后大概是这样的报告(示例):
    🚨 核心异常与劣化痛点
  • COPY 指令引入的 static-serve、entrypoint.sh、httpstat 文件所有权 (Owner 0:0 即 root) 与镜像运行时用户 (ubuntu) 存在权限倒挂,违反最小权限原则。

    🛠️ 必须执行的修复代码
  • 在 USER ubuntu 指令前增加以下指令以修正文件所有权:

    RUN chown ubuntu:ubuntu /usr/local/bin/static-serve /usr/local/bin/httpstat /entrypoint.sh
  • 或在 COPY 指令时直接指定所有者(推荐):

    COPY --chown=ubuntu:ubuntu /static/target/release/static-serve /usr/local/bin/static-serve
    COPY --chown=ubuntu:ubuntu /static/entrypoint.sh /entrypoint.sh
    COPY --chown=ubuntu:ubuntu /usr/local/bin/httpstat /usr/local/bin/httpstat
    下次镜像稳定了再 push ,LLM 自己会回"与上次结论一致",静默不打扰。
    在线 demo / 仓库
  • 直接试: https://ai-diving.npmtrend.com (共享 token + 共享配额,仅演示)
  • 仓库: https://github.com/vicanso/ai-diving ( README 里自托管 5 步走齐了)
  • diving-rs 单独使用: https://github.com/vicanso/diving-rs

    求拍砖、提 issue 、提建议。如果你也有"不依赖 docker daemon 的镜像分析"需求,diving-rs 拎出来单用也行。
  • 您需要登录后才可以回帖 登录 | 立即注册

    返回顶部