大佬们是怎么解决 glm5.2 无法处理视觉理解的问题的 ...

作者：QingmuSanren 发布时间：2026-6-29 15:46:58

现在用的火山引擎的 codig plan ，对 glm5.2 非常满意，但是么美中不足，现在没办法处理视觉理解。我看之前 glm5.1 也是文本模型，是怎么做到可以处理视觉理解的，现在 5.1 下架了。

相关帖子

jotsai 2026-6-29 15:47:43

用的 GLM Coding Plan ，模型服务端已内置 image_analysis 工具，具备图片理解能力 😊
https://docs.bigmodel.cn/cn/coding-plan/mcp/vision-mcp-server#%E6%94%AF%E6%8C%81%E7%9A%84%E5%AE%A2%E6%88%B7%E7%AB%AF

QingmuSanren

OP

2026-6-29 15:48:23

@jotsai glm 的 coding plan 根本抢不到啊，痛，现在只能退而用火山。看大佬发的视觉理解 mcp ，文中说的大概意思就是，再买点搭配的视觉模型 token 一起用？

jotsai 2026-6-29 15:48:56

@QingmuSanren 这个 MCP 应该只是给 GLM Coding Plan 补视觉短板的，非 GLM Coding Plan 的我感觉直接接 1 个原生多模态的大模型比较好吧

Yvyvyv 2026-6-29 15:49:51

让 claude 用文字描述出来

skyemin 2026-6-29 15:50:37

质谱和 coding plan 和火山里面用 glm5.2 的模型有区别吗

106npo 2026-6-29 15:51:11

5.1 是用 4v 外挂识别的
你让 agent 写个 tool ,找个支持视觉输入的模型去按要求描述图片.但肯定效果没原生支持视觉的模型好

QingmuSanren

OP

2026-6-29 15:51:43

@yvyvyv 怎么说大佬

QingmuSanren

OP

2026-6-29 15:52:15

@skyemin glm 的 coding plan 抢不到，所以无法对比，我只能说火山的的 glm5.2 我用起来感觉很不错，值得

大佬们是怎么解决 glm5.2 无法处理视觉理解的问题的

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

大佬们是怎么解决 glm5.2 无法处理视觉理解的问题的

相关帖子

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告