Ubuntu16.04 下编译安装tesseract 4.00.00alpha 及测试

  1. python3 调用
  1. 3.05.01 及 以后的版本没有Linux的二进制包,需要编译安装.

    # 安装相关组件
    sudo apt-get install g++ # or clang++ (presumably)
    sudo apt-get install autoconf automake libtool
    sudo apt-get install autoconf-archive
    sudo apt-get install pkg-config
    sudo apt-get install libpng12-dev
    sudo apt-get install libjpeg8-dev
    sudo apt-get install libtiff5-dev
    sudo apt-get install zlib1g-dev
    sudo apt-get install libicu-dev
    sudo apt-get install libpango1.0-dev
    sudo apt-get install libcairo2-dev
  2. 依赖图像库Leptonica,在编译tesseract前先编译Leptonica, 版本对应关系见Compiling#linux,3.05对应leptonica-1.74.tar.gz

    wget http://www.leptonica.org/source/leptonica-1.74.tar.gz
    tar -xvf leptonica-1.74.tar.gz
    cd leptonica-1.74
    ./configure 
    make
    make install
  3. 编译安装tesseract 4.00.00alpha

    git clone https://github.com/tesseract-ocr/tesseract.git
    cd tesseract
    ./autogen.sh
    ./configure 
    make
    make install

  • wiki

    python3 调用

    sudo pip3 install pytesseract
    import pytesseract
    vcode = pytesseract.image_to_string(im, lang='eng', config='-psm 12 --tessdata-dir /tessdata/')

转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 [email protected]

文章标题:Ubuntu16.04 下编译安装tesseract 4.00.00alpha 及测试

文章字数:206

本文作者:Spaceack

发布时间:2017-08-25, 04:00:00

最后更新:2020-01-21, 03:13:31

原始链接:http://spaceack.com/2017/08/25/2017-08-25%20-ubuntu16-compiling-tesseract4/

版权声明: "署名-非商用-相同方式共享 4.0" 转载请保留原文链接及作者。

目录