Yoo趣儿 › 探索分享 › 分享创造 › 有了这个解析插件，大模型能读取 3000 多项 PDF 文档， ...

有了这个解析插件，大模型能读取 3000 多项 PDF 文档，并根据提问回答问题。

查看 75|回复 1

作者：cxd8190102 发布时间：2026-4-24 17:31:08

现在的大模型虽然上下文窗口大，但理解的范围不大，如果全部丢给它，估计会被塞爆。
如果 PDF 里面还包含了图片、表格等等的话，那就更不用说了。
https://imgur.com/a/Guu8GR2
所以，我做了一个专治非结构化数据的文件解析插件 Knowhere ，它能够识别复杂的 PDF 、Excel 、PPT 等格式，然后把文件按照思维导图的逻辑进行解析，最大程度地保留文档的层级和结构，最后按照格式分门别类，方便大模型的调用和读取。这时候你再向大模型提问，它的回答就靠谱多了。
我测试了一下，对比传统简单粗暴的 RAG ，这种树形结构的拆分法更符合 AI 的学习逻辑，出来的结果也更准确了，大大减少了大模型的幻觉。
有需要的老哥可以试用一下： https://knowhereto.ai/?utm_source=V2EX

解析, 文档, 结构

公告

返回顶部

有了这个解析插件，大模型能读取 3000 多项 PDF 文档，并根据提问回答问题。

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

有了这个解析插件，大模型能读取 3000 多项 PDF 文档，并根据提问回答问题。

相关帖子

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告