请问厂里面一物一码的二维码重复校验,一般怎么做?

查看 245|回复 33
tek   
历史条码严格递增,不允许变小
lmshl   
按二维码的前缀或后缀分库分表,压缩包复制 N 份,各自解压按分表规则导入查重
xyfan   
md5 + hash
xyfan   
如果不能改变上游的话,最简单的方法就是搞一个 bloom filter index ,postgresql 原生支持这种 index 。
如果只能用 mysql 的话,也可以在 mysql 里自己维护实现 bloom filter ,不是很难。
然后做分级索引,合并成一个大的 bloom 。
虽然会有 false positive ,只要控制在 1%以内,你就可以以极高的效率查出哪个码从来没出现过。仅在命中 bloom 的时候去做二次校检。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部