整合了一套开源 OCR 识别方案,支持 HTTP API 调用

查看 48|回复 5
作者:xiaoz   
网上没找到比较适合的现成 OCR 私有部署方案,于是基于百度飞桨平台发布了全新的 PP-OCRv6 识别模型自己整合了一套方案 ZOCR ,支持 Dcoker 部署和 HTTP API 调用。


Zocr 开源地址:https://github.com/helloxz/zocr

Zocr 特点
  • 基于百度飞桨 PP-OCRv6 识别模型,提供两档可选:tiny / small
  • 支持 Bearer Token 认证
  • 支持 Docker 容器化部署
  • 纯 CPU 推理,不依赖 GPU
  • 支持常见图片格式:jpg/jpeg/png/bmp/webp
  • 支持 HTTP 调用
  • 轻量级占用

    Docker Compose 部署
    创建compose.yaml文件:
    services:
      zocr:
        image: helloz/zocr
        container_name: zocr
        ports:
          - "5080:5080"
        environment:
          - ZOCR_TOKEN=your_token_here
        restart: always
    然后输入:docker compose up -d启动。
    注意:请将your_token_here设置为您自己的密钥,支持字母或数字。
    使用
    HTTP API 支持 2 种接口,一种是上传文件识别,一种是通过传递图片 URL 进行识别,调用方法如下:
    # 使用 curl 调用(上传文件)
    curl -X POST http://localhost:5080/api/ocr/upload \
      -H "Authorization: Bearer your_token" \
      -F "[email protected]"
    # 使用 curl 调用(通过 URL )
    curl "http://localhost:5080/api/ocr/fetch?url=https://example.com/image.jpg" \
      -H "Authorization: Bearer your_token"
    DEMO
    在线演示地址:https://zocr.xphub.dev/
    需要输入 Token:blog.xiaoz.org,此 Token 有效期 7 天,后续我会修改 Token 纯自用。

    OCR, 部署, API

  • zsj1029   
    最近 x 上看到的,听说很牛的,甚至可以跑在 webassembly 本地 ocr 模型
    xiaoz
    OP
      
    @zsj1029 #1 ,是的,我试了下效果还不错,而且速度很快。宣传的本地浏览器就能跑,不过浏览器上我还没测试过。
    wshjdx   
    善,已经部署
    xiaoz
    OP
      
    @wshjdx #3,祝你使用愉快,有什么建议也可以去 Github 反馈,感谢。
    burp2019   
    体验了下速度挺快,你意思是模型开源,可以离线部署么
    您需要登录后才可以回帖 登录 | 立即注册

    返回顶部