Yoo趣儿 › 探索分享 › 分享创造 › 写了个 bench 比较能打的智能体框架

写了个 bench 比较能打的智能体框架

查看 82|回复 0

作者：xlianglx 发布时间：2026-1-18 02:22:16

https://github.com/polyuiislab/infiAgent
写了个智能体框架，先用本地 20b 测了 deepresearch 的 bench,竟然比 grok 的 deepresearch 分高😂，然后做了几个常见的智能体类型，AI Scientist （自动化研究实验，半通用型），Cowork （类似 anthropic 的 cowork：编程，做 ppt ，整理桌面，通用型）。AI Scientist 测的挺多，做实验比较方便，写出来的文章过一些 ei 会议投稿没什么问题。Cowork 即使是用 docker 隔离了目标文件夹和宿主机，我感觉还是很危险...不知道 anthropic 官方的 Cowork 有没有出现把人文件删了的事情

返回列表

公告

返回顶部

写了个 bench 比较能打的智能体框架

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

写了个 bench 比较能打的智能体框架

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告