大型 Trie 树数据库的尝试,期望在 RAG 系统中发挥作用

查看 317|回复 24
maggch97   
我只觉得你的数据结构知识学的很一般。首先 trie 做存储并不是什么特立独行的想法,每个刚学数据结构的人都会觉得这个结构简直无敌,非常适合做数据库。
但是为什么这么简单的结构,看起来这么 work 的想法还没有成熟的项目应用呢。聪明的人知道去搜一下前人的讨论,“固执”的人会真的搞出来并强行推销给大家,不过并没有人接受就是了。
bigtang
OP
  
我觉得你既不懂数据结构,也不懂数据库,更不懂 AI
nomagick   
@shyrock 你说的是 TF-IDF 还有 pagerank 这些? tanglib 目前只做了半个解决方案,ai 与 tanglib 之间可进行多次交互,发现关键词量太大继续限定,而百度以及原来的搜索必须一次给出结果,其实这些方法都很大概率不可靠,很多时候明明知道有百度就是找不到,这种时候不少吧?
bigtang
OP
  
字符精确匹配才是真正的小众需求。。。
bigtang
OP
  
@nomagick 我说的是给 ai 提供素材,不是给最终用户。。。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部