@e23nome 搜这个标题,唯一一条把 GLM5.2 和 Fable5 比的是楼主的帖子,全网震撼首发。 其他的文章要么在比 opus4.8 ,并且说在某个数据集上差几个点;要不是在对比关闭访问的 fable 和开放的 GLM 。 除了本帖之外没有任何一个地方有 GLM 接近 Fable 的说法
@lujiaosama 以下是我比较信任的榜单,至于准不准,或算不算野榜,就见仁见智了 https://arena.ai/leaderboard/code https://artificialanalysis.ai/models?intelligence=coding-index https://llm2014.github.io/llm_benchmark/#category=code_v3&dataset=code_v3%7C2026-06%7C0 关于 HARNESS ,就看这个 coding-agents 榜,但 glm5.2 的成绩还没出 https://artificialanalysis.ai/agents/coding-agents