Yoo趣儿 › Geek › 程序员 › 大家在做目标检测落地时会考虑用 VL 大模型直接做识别吗 ...

大家在做目标检测落地时会考虑用 VL 大模型直接做识别吗？

查看 87|回复 2

作者：monstericeer 发布时间：2026-4-2 08:45:22

最近在测试 Qwen3-VL ，Doubao-seed-2 这类的目标识别能力，尤其是豆包在很多复杂场景不需要训练就能标注得非常准确，能够在用法上更加灵活，对比 yolo 需要大量的训练数据，不断迭代。
想请教各位是否有尝试过用大模型做自动标注辅助 yolo 训练，或者直接用在生产环境？

VL, 大模型, 目标检测

相关帖子

iasnull 2026-4-2 08:46:18

看具体场景，各有优劣。比如最近的大模型在单字符级别的识别能力比较差，在比较大且明显的 2d 特征物体的识别能力就很厉害，能抗噪声和失真。

giserd 2026-4-2 08:47:04

VL 模型开销远高于 yolo 之类的目标识别,单纯目标识别还是感觉 yolo 更靠谱

AD1

热门主题

热门板块

问与答分享发现分享创造奇思妙想分享邀请码商业推广优惠信息 Python PHP Java JavaScript Node.js Go语言 C++HTML

公告

返回顶部