1936

Centos7 yum安装tesseract-ocr 4.1

Tesseract是github上的OCR开源库

使用官方源

yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/

安装密钥

sudo rpm --import https://build.opensuse.org/projects/home:Alexander_Pozdnyakov/public_key

执行安装

yum install tesseract

安装语言包

前往github下载对应版本的中文语言包(chi_sim.traineddata)
https://github.com/tesseract-ocr/tessdata/tree/4.1.0

将语言包放至如下目录

/usr/share/tesseract/4/tessdata/

使用tesseract识别图片文字

tesseract ./tmp.png stdout -l chi_sim --dpi 100
文章作者:DOTATONG
发布日期:2021-11-18

评论

暂无

添加新评论