为什么放弃了 RAG? RAG 的六大难题

查看 207|回复 30
CoderGeek   
分词 检索 权重 - - 感觉企业知识库 定制客服之类的 还是那样 提取完加 AI 选择一下 走个聊天机器人 一直没太搞懂这个 RAG  我本地搭了 dify 把我自己之前学 MBA 的整体资料罐给他 做个 MBA 课程老师玩 配着配着感觉都是问题
karld   
真假 效果提升多少!
orion1   
没玩过,感谢
murmur   
@zhengfan2016 说错了,你说小红书我可能还认为高深,b 站的推荐系统完全是基于 tag 做的,因为当你喜欢上一个内容之后,带着标签的黑稿全推到首页上来了,所以证明他完全不检测相似度,就是看打了什么 tag
而且首页 5 个视频里必定一个商单一个广告
简而言之 b 站推荐系统屎中屎,不具备技术研究讨论的价值
MoozLee   
ai 能力提升的必然吧。本来需要更多人为的编排流程,现在 ai 能力强了自然就减少了这块的需求。
qaqbreak   
这个是不是相当于做了个摘要,然后用摘要进行检索了
NoobNoob030   
思路很好,感谢分享
imxiaolong   
现在用 google 的 notebookLm ,挺好用的。可以根据以往文件生成我想要的方案。
zwithz1998   
主要还是看使用场景,你的使用场景很明确了,是本地应用,使用 RAG 成本反而很高。
像企业知识库(如飞书)这类的协同文档平台,只能构建 RAG ,并且协同文档涉及到文档权限的问题,直接使用路径去构建上下文,反而会导致信息泄露。
Ketteiron   
@zhengfan2016 #6 这是用户画像系统+推荐系统。
RAG 主要是节约成本的前提下为 AI 提供合理的上下文,但目前向量搜索的命中率实在扯淡,很长一段时间直到现在,这种模式一般是用来骗投资的,没多少现实意义。
最合理的还得是 Agentic RAG + 深度预处理,将资料完全数字化,让 AI 整理、打标签、抽样、归纳、建立依赖关系,当需要检索时让 AI 自主决定调取什么资料。
OP 的方案本质上也是深度预处理的一种,比知识图谱化省钱,但其正确性由文档本身的结构化程度决定
您需要登录后才可以回帖 登录 | 立即注册

返回顶部