windows安装tesseract-ocr

  • A+
所属分类:Python

一、安装步骤

  1. 双击tesseract-ocr-w64-setup-5.3.4.20240503.exe 安装包,点击ok
    windows安装tesseract-ocr
  2. 点击【Next】

     

    windows安装tesseract-ocr
  3. 点击【I Agree】

     

    windows安装tesseract-ocr
  4. 点击【Next】

     

    windows安装tesseract-ocr
  5. 选择安装组件

     

    windows安装tesseract-ocr
  • 展开【Additional language data】
  • 勾选 【Math / equation detection module】和 【Chinese(Simplified)】
  • 点击 【Next】
  1. 选择安装路径

     

    windows安装tesseract-ocr
  2. 点击【Install】

     

    windows安装tesseract-ocr
  3. 点击【Next】

     

    windows安装tesseract-ocr

    image.png

  4. 点击【Finish】

     

    windows安装tesseract-ocr
  5. 新建系统变量,变量名为:TESSERACT_HOME,变量值为刚刚选择的安装路径
    windows安装tesseract-ocr

    image.png

  6. 编辑环境变量(Path),新建,并填写:%TESSRACT_HOME%
    windows安装tesseract-ocr

安装完成

windows安装tesseract-ocr

在一张待识别图片的目录下,打开command窗口,执行:

tesseract 七镜主页.jpg 图像转文字结果 -l chi_sim
  • tesseract:工具名
  • 七镜主页.jpg:图像名
  • 图像转文字结果:指定输出转换结果的的txt文件名
  • -l chi_sim:指定识别语言为简体中文
windows安装tesseract-ocr
  • 打开图像转文字结果.txt 可以看到识别结果,不是特别完美,不过基本上够用了,毕竟一般还要做二次加工的。
  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin