玩转个人知识库! Paperless-ngx 增强版: VLM 视觉识别、无限树形目录、Chat with Doc 文档对话

查看 8|回复 0
作者:510908220   
大家好,
相信很多 V 友都有管理发票、说明书、合同和旧纸质文件的烦恼。Paperless-ngx 是目前开源界强大的文档管理系统,支持 OCR 、自动打标签和全文搜索。
但是官方原版在实际部署中(尤其是中文环境下)可能会遇到一些门槛以及 AI 功能支持不足。所以我维护了一个优化版本:CallStorm/paperless-ngx
🚀 相比原版,这个 Fork 解决了什么?
我主要针对中文环境和智能化做了以下核心增强:
1. 真正的“看图说话” (VLM 视觉模型)
原版 Tesseract OCR 面对手机随手拍的歪歪扭扭的票据、皱巴巴的纸张,识别率往往惨不忍睹。
  • 增强后:引入了 VLM (视觉模型)。它不是死板地识别字符,而是像人眼一样“理解”图片。
  • 效果:哪怕照片光线不好、有折痕,它也能精准提取出“发票金额”、“保修日期”等关键信息。

    2. 支持无限级“树形目录”
    原版 Paperless 强推“标签( Tag )”逻辑,但对于很多习惯 Windows 资源管理器一层层文件夹分类的朋友来说,非常反直觉。
  • 增强后:实现了直观的树形目录体系。你可以像在电脑上一样创建无限层级的文件夹,文件上传到目录后会自动继承标签,既有目录的结构,又有标签的灵活。

    3. 文档对话 (Chat with Doc)
    文档存进去不再是死数据。
  • 增强后:集成 LLM 。你可以在文档详情页直接问它:“这份保险合同涵盖哪些大病?”、“这个宽带什么时候到期?”,它会基于文档内容回答你,不用自己去翻几千字的小字条款。

    4. 优化部署
  • 预置了中文 OCR 语言包配置,解决了原版常见的中文乱码或识别率低的问题。
  • 优化了 Dockerfile 镜像开箱即用,省去了繁琐的环境配置。

    📸 截图预览

    🚧 后续计划
    目前的版本已经可以稳定满足日常归档需求。后续计划加入语义搜索(不再依赖关键词,搜意思也能搜到)和全局 AI 助手。
    希望能帮到同样有收纳强迫症、或者喜欢折腾 NAS 的朋友、或者喜欢打造自己的知识库的人。
    如果有 Bug 或建议,欢迎在 GitHub 提 Issue 或 PR ,感谢!
    传送门:https://github.com/CallStorm/paperless-ngx
  • 您需要登录后才可以回帖 登录 | 立即注册

    返回顶部