Ubuntu16.04 下编译安装tesseract 4.00.00alpha 及测试

  1. python3 调用
  1. 3.05.01 及 以后的版本没有Linux的二进制包,需要编译安装.

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    # 安装相关组件
    sudo apt-get install g++ # or clang++ (presumably)
    sudo apt-get install autoconf automake libtool
    sudo apt-get install autoconf-archive
    sudo apt-get install pkg-config
    sudo apt-get install libpng12-dev
    sudo apt-get install libjpeg8-dev
    sudo apt-get install libtiff5-dev
    sudo apt-get install zlib1g-dev
    sudo apt-get install libicu-dev
    sudo apt-get install libpango1.0-dev
    sudo apt-get install libcairo2-dev
  2. 依赖图像库Leptonica,在编译tesseract前先编译Leptonica, 版本对应关系见Compiling#linux,3.05对应leptonica-1.74.tar.gz

    1
    2
    3
    4
    5
    6
    wget http://www.leptonica.org/source/leptonica-1.74.tar.gz
    tar -xvf leptonica-1.74.tar.gz
    cd leptonica-1.74
    ./configure
    make
    make install
  3. 编译安装tesseract 4.00.00alpha

    1
    2
    3
    4
    5
    6
    git clone https://github.com/tesseract-ocr/tesseract.git
    cd tesseract
    ./autogen.sh
    ./configure
    make
    make install

  • wiki

    python3 调用

    1
    sudo pip3 install pytesseract
    1
    2
    import pytesseract
    vcode = pytesseract.image_to_string(im, lang='eng', config='-psm 12 --tessdata-dir /tessdata/')

转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 [email protected]

文章标题:Ubuntu16.04 下编译安装tesseract 4.00.00alpha 及测试

文章字数:188

本文作者:Spaceack

发布时间:2017-08-25, 12:00:00

最后更新:2020-03-30, 06:07:12

原始链接:http://spaceack.com/2017/08/25/2017-08-25-ubuntu16-04%E7%BC%96%E8%AF%91%E5%AE%89%E8%A3%85tesseract4/

版权声明: "署名-非商用-相同方式共享 4.0" 转载请保留原文链接及作者。

目录
×

喜欢就点赞,疼爱就打赏