超大型文件比较,内存不足,只能分页读区再匹配,但头都秃了,也没想到优化的方式,朋友们帮帮忙啊。

查看 279|回复 23
FeifeiJin
OP
  
可以把 name 分组,比如先把两个文件中所有 a 开头的行读入内存比较,然后再比较 b 、c 。分组粒度大小按照内存大小来。
matrix1010   
@geelaw
谢谢您, 这个方法是行得通的。目前不想外部排序,实在走不通,再走这条路。
laike9m   
用不了数据库但你可以参考数据库的做法: https://dev.mysql.com/blog-archive/hash-join-in-mysql-8/
ipwx   
@FeifeiJin 没看出为什么不能
您需要登录后才可以回帖 登录 | 立即注册

返回顶部