做了一个给 AI 智能体做实时安全拦截的开源工具，欢迎来 ...

起因是我在用 Claude Code 的时候，突然意识到这东西有完整权限在我电脑上跑，我完全不知道它下一步会干什么。
现在 Claude Code 、Cursor 这类智能体工具越来越能干，能直接操作文件、跑脚本、调接口。但出事了怎么办？强制删除系统文件跑了，密钥泄了，一步步看起来没问题的操作组合成了数据外泄链路……
然后就做了这个： https://github.com/chenglin1112/AgentTrust
简单说就是在智能体和工具之间加一层保护，每个操作执行前先过安全检查，拦得住就拦，拦不确定就让语言模型来判断，判断有风险就锁住，顺带告诉你怎么改。
比较有意思的功能是攻击链检测——单独看「读取配置文件」没问题，单独看「发请求到外部地址」也没问题，但两步连起来再加个编码操作就是数据外泄，会被识别并拦截。
现在已经支持协议原生接入，Claude Code 和 Cursor 配置很简单。
还很早期，测试集是合成数据，生产环境没验证过。但如果你在跑智能体，可以试试，欢迎来找茬。
Python 3.9 以上，Apache 2.0 协议。

做了一个给 AI 智能体做实时安全拦截的开源工具，欢迎来喷

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则