@zhengfan2016 说错了,你说小红书我可能还认为高深,b 站的推荐系统完全是基于 tag 做的,因为当你喜欢上一个内容之后,带着标签的黑稿全推到首页上来了,所以证明他完全不检测相似度,就是看打了什么 tag
而且首页 5 个视频里必定一个商单一个广告
简而言之 b 站推荐系统屎中屎,不具备技术研究讨论的价值
@zhengfan2016 #6 这是用户画像系统+推荐系统。
RAG 主要是节约成本的前提下为 AI 提供合理的上下文,但目前向量搜索的命中率实在扯淡,很长一段时间直到现在,这种模式一般是用来骗投资的,没多少现实意义。
最合理的还得是 Agentic RAG + 深度预处理,将资料完全数字化,让 AI 整理、打标签、抽样、归纳、建立依赖关系,当需要检索时让 AI 自主决定调取什么资料。
OP 的方案本质上也是深度预处理的一种,比知识图谱化省钱,但其正确性由文档本身的结构化程度决定