ai 大模型推荐(能够本地部署，支持win/linux) ...

作者：XMQ 发布时间：2025-9-20 03:19:48

公司有个需求，希望能找个本地部署的模型，能够实现对pdf文件，wod/excel 文件进行ocr解析，要求准确率在98以上，并且能够从解析出来的文件，根据输入的要求来进行整理和输出，最好能够直接生成excel文件或者相对应入库的数据，方便使用py脚本直接入库。尽量平民化部署。类似这种，只需要提前文件里面表格的内容就可以，用kimi和deespeek 网页版可以达到想要的效果，但是公司未来数据安全想本地化部署，利用api的方式来批量跑。各位大神有什么好的模型介绍或者方法。
[i]

文件, 模型

相关帖子

xiangye 2025-9-20 03:20:40

可以本地化用dify+anythingllm+Umi-OCR，我们本地化部署就是这样本地知识库加流程排布完成业务ai需求的，简单表格精度还可以。也试过TrWebOCR、PaddleOCR、Surya等一些，复杂表格不太行，你这种简单表格还好，带公式和嵌套计算的表格处理起来麻烦一些。另外也实验了，这几天在试Ollama OCR，git上新更新了，新更新的支持pdf和图片了，试试效果。

xiangye 2025-9-20 03:21:30

本地化模型用过deepseek1.5b，7b，qwq8b，精度测试过8的，16的，最后上资源现在用的70b模型，基本够业务用了。

bester 2025-9-20 03:22:08

xiangye 发表于 2025-3-30 21:55
可以本地化用dify+anythingllm+Umi-OCR，我们本地化部署就是这样本地知识库加流程排布完成业务ai需求的，简 ...
自己部署的话，那怎么分给同事用呢？应该要有一个UI或者网页吧？

121888598 2025-9-20 03:22:54

楼主是完全不在意啥图就放网上啊

paster 2025-9-20 03:23:41

deepin系统里面的uos ai，ai部署工具。去试试。

iSummer999 2025-9-20 03:24:18

本地部署deepseek就行，做个网页让同事使用就行

maoloye 2025-9-20 03:25:10

這麽私密的圖能放到網上嗎？

FCGkitty 2025-9-20 03:25:41

你这玩意不需要大模型啊，网上通用的PDF识别库都可以，然后写个对应的PY脚本对识别结果整理就行了啊，要啥大模型啊

XMQ

OP

2025-9-20 03:26:35

xiangye 发表于 2025-3-30 22:00
本地化模型用过deepseek1.5b，7b，qwq8b，精度测试过8的，16的，最后上资源现在用的70b模型，基本够业务用 ...
公司有14b，但是解析出来效果不行，有些数据会缺失

ai 大模型推荐(能够本地部署，支持win/linux)

相关帖子

热门主题

我的工具微信小程序流量下滑，想找个网站打

蹭波热度~！聊聊最近论坛上的ddos攻击

这种怀旧网站是靠什么盈利的呢？

脚本小子不光没技术，躲在论坛里，一直看着

今晚更新了

[2026.6.27]WIN11.29617.1000轻度精简版 Wi

7zip ZS 更新至 26.02

脚本小子攻击20-30g带宽，也就这点堵带宽的

才发现论坛竟然还有这个功能

udp放大攻击带宽，和syn和cc，主流就这几种

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

ai 大模型推荐(能够本地部署，支持win/linux)

相关帖子

热门主题

我的工具微信小程序流量下滑，想找个网站打

蹭波热度~！聊聊最近论坛上的ddos攻击

这种怀旧网站是靠什么盈利的呢？

脚本小子不光没技术，躲在论坛里，一直看着

今晚更新了

[2026.6.27]WIN11.29617.1000轻度精简版 Wi

7zip ZS 更新至 26.02

脚本小子攻击20-30g带宽，也就这点堵带宽的

才发现论坛竟然还有这个功能

udp放大攻击带宽，和syn和cc，主流就这几种

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

在 Yoo趣儿投放广告