玩转个人知识库！ Paperless-ngx 增强版： VLM 视觉识别 ...

大家好，
相信很多 V 友都有管理发票、说明书、合同和旧纸质文件的烦恼。Paperless-ngx 是目前开源界强大的文档管理系统，支持 OCR 、自动打标签和全文搜索。
但是官方原版在实际部署中（尤其是中文环境下）可能会遇到一些门槛以及 AI 功能支持不足。所以我维护了一个优化版本：CallStorm/paperless-ngx。
🚀 相比原版，这个 Fork 解决了什么？
我主要针对中文环境和智能化做了以下核心增强：
1. 真正的“看图说话” (VLM 视觉模型)
原版 Tesseract OCR 面对手机随手拍的歪歪扭扭的票据、皱巴巴的纸张，识别率往往惨不忍睹。

增强后：引入了 VLM （视觉模型）。它不是死板地识别字符，而是像人眼一样“理解”图片。

效果：哪怕照片光线不好、有折痕，它也能精准提取出“发票金额”、“保修日期”等关键信息。

2. 支持无限级“树形目录”
原版 Paperless 强推“标签（ Tag ）”逻辑，但对于很多习惯 Windows 资源管理器一层层文件夹分类的朋友来说，非常反直觉。

增强后：实现了直观的树形目录体系。你可以像在电脑上一样创建无限层级的文件夹，文件上传到目录后会自动继承标签，既有目录的结构，又有标签的灵活。

3. 文档对话 (Chat with Doc)
文档存进去不再是死数据。

增强后：集成 LLM 。你可以在文档详情页直接问它：“这份保险合同涵盖哪些大病？”、“这个宽带什么时候到期？”，它会基于文档内容回答你，不用自己去翻几千字的小字条款。

4. 优化部署

预置了中文 OCR 语言包配置，解决了原版常见的中文乱码或识别率低的问题。

优化了 Dockerfile 镜像开箱即用，省去了繁琐的环境配置。

📸 截图预览

🚧 后续计划
目前的版本已经可以稳定满足日常归档需求。后续计划加入语义搜索（不再依赖关键词，搜意思也能搜到）和全局 AI 助手。
希望能帮到同样有收纳强迫症、或者喜欢折腾 NAS 的朋友、或者喜欢打造自己的知识库的人。
如果有 Bug 或建议，欢迎在 GitHub 提 Issue 或 PR ，感谢！
传送门：https://github.com/CallStorm/paperless-ngx

玩转个人知识库！ Paperless-ngx 增强版： VLM 视觉识别、无限树形目录、Chat with Doc 文档对话

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则