1.我有一个表A(10万行左右) 2.我有四个表BCDE,每个一百万行左右(字段相同,数据唯一) 3.用A表的A列的数据 去匹配表BCDE的H行数据,如果匹配到,就把该行数据写入的A表对应的行的后面。 4.我用传统的方法,写的 运行太慢了,有没有好的方法,AI生成的回答,就不用回答了,我也会用ai。 数据, 比对
1. 读取bcde文件中的数据,然后生成md5值,将这些md5值放入dict1中,key就是md5值,value是内容 2. 循环遍历a文件,按行生成md5,判断是否在dict中,如果存在,就将a放入新的dict2中,key是md5值,value是合并后的内容 3. 最后将dict2的values写入新文件即可; 前提是你的value不能很大,如果value很大,那么dict1中的value就只能存放文件名称,行数;在步骤3中再去做聚合;因为文件a中只有10w,处理起来应该很快