相信很多 V 友都有管理发票、说明书、合同和旧纸质文件的烦恼。Paperless-ngx 是目前开源界强大的文档管理系统,支持 OCR 、自动打标签和全文搜索。
但是官方原版在实际部署中(尤其是中文环境下)可能会遇到一些门槛以及 AI 功能支持不足。所以我维护了一个优化版本:CallStorm/paperless-ngx。
🚀 相比原版,这个 Fork 解决了什么?
我主要针对中文环境和智能化做了以下核心增强:
1. 真正的“看图说话” (VLM 视觉模型)
原版 Tesseract OCR 面对手机随手拍的歪歪扭扭的票据、皱巴巴的纸张,识别率往往惨不忍睹。
2. 支持无限级“树形目录”
原版 Paperless 强推“标签( Tag )”逻辑,但对于很多习惯 Windows 资源管理器一层层文件夹分类的朋友来说,非常反直觉。
3. 文档对话 (Chat with Doc)
文档存进去不再是死数据。
4. 优化部署
📸 截图预览
🚧 后续计划
目前的版本已经可以稳定满足日常归档需求。后续计划加入语义搜索(不再依赖关键词,搜意思也能搜到)和全局 AI 助手。
希望能帮到同样有收纳强迫症、或者喜欢折腾 NAS 的朋友、或者喜欢打造自己的知识库的人。
如果有 Bug 或建议,欢迎在 GitHub 提 Issue 或 PR ,感谢!
传送门:https://github.com/CallStorm/paperless-ngx

