大家在做目标检测落地时会考虑用 VL 大模型直接做识别吗?

查看 20|回复 2
作者:monstericeer   
最近在测试 Qwen3-VL ,Doubao-seed-2 这类的目标识别能力,尤其是豆包在很多复杂场景不需要训练就能标注得非常准确,能够在用法上更加灵活,对比 yolo 需要大量的训练数据,不断迭代。
想请教各位是否有尝试过用大模型做自动标注辅助 yolo 训练,或者直接用在生产环境?

VL, 大模型, 目标检测

iasnull   
看具体场景,各有优劣。比如最近的大模型在单字符级别的识别能力比较差,在比较大且明显的 2d 特征物体的识别能力就很厉害,能抗噪声和失真。
giserd   
VL 模型开销远高于 yolo 之类的目标识别,单纯目标识别还是感觉 yolo 更靠谱
您需要登录后才可以回帖 登录 | 立即注册

返回顶部