上亿数据,如何完成快速检索

查看 185|回复 13
matrix1010   
@zhuzhibin N-gram 空间换时间,一般来说 2gram 或 3gram 效果都很不错, 你也可以两个加一起。比如 google code search 就是 trigram: https://github.com/google/zoekt
Sakura0Tears   
只会 Excel 难蚌
matrix1010   
@zhuzhibin 刚才没注意到是 wildcard, 可以顺便看看这个: https://tech.justgiving.com/posts/how-i-discovered-the-power-of-trigrams-for-text-search-in-sql-server
owen800q   
Serverless 版本的 mongodb, 别说一亿,100 亿都没问题
您需要登录后才可以回帖 登录 | 立即注册

返回顶部