公司有个需求,希望能找个本地部署的模型,能够实现对pdf文件,wod/excel 文件进行ocr解析,要求准确率在98以上,并且能够从解析出来的文件,根据输入的要求来进行整理和输出,最好能够直接生成excel文件或者相对应入库的数据,方便使用py脚本直接入库。尽量平民化部署。类似这种,只需要提前文件里面表格的内容就可以,用kimi和deespeek 网页版可以达到想要的效果,但是公司未来数据安全想本地化部署,利用api的方式来批量跑。各位大神有什么好的模型介绍或者方法。 [i] 文件, 模型
可以本地化用dify+anythingllm+Umi-OCR,我们本地化部署就是这样本地知识库加流程排布完成业务ai需求的,简单表格精度还可以。也试过TrWebOCR、PaddleOCR、Surya等一些,复杂表格不太行,你这种简单表格还好,带公式和嵌套计算的表格处理起来麻烦一些。另外也实验了,这几天在试Ollama OCR,git上新更新了,新更新的支持pdf和图片了,试试效果。
xiangye 发表于 2025-3-30 21:55 可以本地化用dify+anythingllm+Umi-OCR,我们本地化部署就是这样本地知识库加流程排布完成业务ai需求的,简 ... 自己部署的话,那怎么分给同事用呢?应该要有一个UI或者网页吧?
xiangye 发表于 2025-3-30 22:00 本地化模型用过deepseek1.5b,7b,qwq8b,精度测试过8的,16的,最后上资源现在用的70b模型,基本够业务用 ... 公司有14b,但是解析出来效果不行,有些数据会缺失