不了解 funcaptcha ,但是是 Deep learning 从业者。现在工业界的训练集都是按照 billion 来计量的,至少是 million 级别的。一万个样本基本算是大学课程里的 play ground 的。如果楼主只是玩玩的话,1 万个应该是够了。但是是想做产品的话,还是得需要大平台和大数据才行。
@hokman 如果目标集合有限且不大的的话,似乎可以穷举?不了解 funcaptcha 是什么样的,如果是会不断扩充的话,模型需要足够的泛化性才能 work 。如果准确率只要 50%的话,用一些简单的规则判断是不是也可以?