ai 大模型推荐(能够本地部署,支持win/linux)

查看 71|回复 9
作者:XMQ   
公司有个需求,希望能找个本地部署的模型,能够实现对pdf文件,wod/excel 文件进行ocr解析,要求准确率在98以上,并且能够从解析出来的文件,根据输入的要求来进行整理和输出,最好能够直接生成excel文件或者相对应入库的数据,方便使用py脚本直接入库。尽量平民化部署。类似这种,只需要提前文件里面表格的内容就可以,用kimi和deespeek 网页版可以达到想要的效果,但是公司未来数据安全想本地化部署,利用api的方式来批量跑。各位大神有什么好的模型介绍或者方法。
[i]

文件, 模型

xiangye   

可以本地化用dify+anythingllm+Umi-OCR,我们本地化部署就是这样本地知识库加流程排布完成业务ai需求的,简单表格精度还可以。也试过TrWebOCR、PaddleOCR、Surya等一些,复杂表格不太行,你这种简单表格还好,带公式和嵌套计算的表格处理起来麻烦一些。另外也实验了,这几天在试Ollama OCR,git上新更新了,新更新的支持pdf和图片了,试试效果。
xiangye   

本地化模型用过deepseek1.5b,7b,qwq8b,精度测试过8的,16的,最后上资源现在用的70b模型,基本够业务用了。
bester   


xiangye 发表于 2025-3-30 21:55
可以本地化用dify+anythingllm+Umi-OCR,我们本地化部署就是这样本地知识库加流程排布完成业务ai需求的,简 ...

自己部署的话,那怎么分给同事用呢?应该要有一个UI或者网页吧?
121888598   

楼主是完全不在意啥图就放网上啊
paster   

deepin系统里面的uos ai,ai部署工具。去试试。
iSummer999   

本地部署deepseek就行,做个网页让同事使用就行
maoloye   

這麽私密的圖能放到網上嗎?
FCGkitty   

你这玩意不需要大模型啊,网上通用的PDF识别库都可以,然后写个对应的PY脚本对识别结果整理就行了啊,要啥大模型啊
XMQ
OP
  


xiangye 发表于 2025-3-30 22:00
本地化模型用过deepseek1.5b,7b,qwq8b,精度测试过8的,16的,最后上资源现在用的70b模型,基本够业务用 ...

公司有14b,但是解析出来效果不行,有些数据会缺失
您需要登录后才可以回帖 登录 | 立即注册

返回顶部