搜索引擎开始替你下结论之后,查资料反而更要小心了

查看 34|回复 2
作者:cxd8190102   
最近在准备一个技术分享,里面有一段要讲某个方案的选型背景。这个领域我不是特别熟,以前的做法就是 Google 一圈,看几篇博客、官方文档和 issue ,再自己整理。
现在会下意识先问 AI 搜索。它确实很快,几秒钟就能给你一段像样的总结,甚至还能顺手列出优缺点。


但问题也在这里:如果我直接把这段总结写进文章里,结果方案理解错了、引用了过期信息,或者漏掉了一个关键限制,发出去就很尴尬。尤其是写技术分享、做汇报、给团队提方案的时候,错的不只是一个答案,而是后面整套判断。
以前搜索引擎主要给链接,你至少会点进去看看是谁写的、什么时候写的、有没有上下文。现在 AI 搜索经常直接给结论,人很容易懒得再点原文。
我最近看到一篇 MIT 相关的论文,里面提到一个挺值得注意的点:AI 搜索更容易引用头部网站,长尾网站会更难被看见。也就是说,很多细节博客、论坛讨论、issue 里的反例,可能还在网上,但在 AI 总结里被压掉了。


这件事对内容创作者也挺伤。以前用户搜到你的文章,至少会进来看看。现在你的内容可能被 AI 用来生成答案,但用户看到的只是搜索页上的一段总结。
对使用者来说,麻烦在于你很难知道这段总结漏了什么。
比如 AI 说:
目前业内普遍认为,某某方案在成本和稳定性之间取得了较好平衡。
这句话看起来很稳,但继续追就会发现问题:
  • “业内”具体是谁;
  • 引用了几篇文章;
  • 有没有反例;
  • 有没有过期内容;
  • 有没有把不同场景揉成一个结论。

    这个问题放到企业内部知识库里更明显。你问“这个 PRD 相比上一版改了什么”“这份合同有没有风险”“某个客户以前投诉过什么”,如果 AI 只回一句“根据资料显示,没有明显问题”,我是不敢直接信的。
    真正重要的不是它总结得顺不顺,而是能不能追到原文。
    这也是我最近试 Knowhere 的原因。它不是那种单纯“上传文档然后聊天”的玩具感知识库,更像是给自己的资料加一层可检索的文档记忆。PDF 、网页、表格、内部文档先丢进去,后面问问题时,它能把相关原文找出来。


    比较适合程序员的一点是 Knowhere MCP 。比如我平时在 Cursor 里写东西,就可以把 Knowhere 接进去,让 Cursor / Claude / Codex 这类客户端直接查这批资料。用法大概是:
    [ol]
  • 把技术文档、调研资料、PRD 、客户记录之类的资料放进 Knowhere 。
  • 接上 Knowhere MCP 。
  • 在 AI 客户端里提问,但要求它先给来源,再给结论。
    [/ol]
    比如:
    对比这两版 PRD ,列出权限相关的改动,附原文片段。
    或者:
    根据这些调研资料,总结三个选型风险,每个风险都要给出处。
    这种体验和普通 AI 搜索不太一样。不是让 AI 直接替你拍板,而是让它先把证据翻出来,你再判断。
    当然,工具也不是万能的。资料本身不全,或者原文就错了,AI 也救不了。关键结论最后还是要人核一遍。
    但我觉得这个方向是对的:AI 越会总结,我们越要关心它凭什么总结。
    以后用 AI 搜索或者知识库工具,我基本都会多问一句:
    这句话的依据是什么?
    能给出处、能回到原文、能看到上下文,才算是可用答案。否则再顺滑,也只是一个很会说话的黑盒。
    所用工具在这: https://knowhereto.ai/?utm_source=v2ex
    开源仓库: https://github.com/Ontos-AI/knowhere
    感兴趣的可以自取,欢迎交流反馈。

    AI, 总结, 来源

  • ztm0929   
    通篇 AI 生成的「不是 xxx ,而是 xxx 」
    > 这也是我最近试 Knowhere 的原因。
    这工具不是你自己开发的吗?何来所谓的「试」?你这篇文章看上去更像是让 AI 扮演一个用户来阐述体验感受,然而这是不真实的,你要么邀请真实用户来写感受,要么自己分享开发思路,没必要这样包装。。。
    @Livid 请问这类内容能否移动到推广的节点呢?
    ztm0929   
    https://www./t/1224831#reply2
    又来一篇垃圾文章。。。
    您需要登录后才可以回帖 登录 | 立即注册

    返回顶部