当前位置:

Tesseract OCR图像识别类库 v5.3.4

收藏
举报
Tesseract OCR图像识别类库包含了一个OCR引擎 - libtesseract和一个命令行程序 - tesseract。Tesseract 4添加了新的基于LSTM的OCR引擎,该引擎专注于行识别,但仍支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式来工作。通过使用传统OCR引擎模式(--oem 0),可以与Tesseract 3兼容。它还需要训练有
  • 作者:
    暂无
  • 演示网站:
    暂无
  • 当前版本:
    v5.3.4
  • 日期:
    2024-02-12
  • 相关链接:
    Home Page
  • 所属分类:
    贺卡图片 C++
  • 软件评级:
  • 下载人气:
    727
免费下载
求购此源码
应用截图
源码详情
免费下载
联系客服/入群
源码属性
授权 开源
大小 2.38MB
语言 C++
运行环境 C++
功能介绍
Tesseract OCR图像识别类库包含了一个OCR引擎 - libtesseract和一个命令行程序 - tesseract。Tesseract 4添加了新的基于LSTM的OCR引擎,该引擎专注于行识别,但仍支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式来工作。通过使用传统OCR引擎模式(--oem 0),可以与Tesseract 3兼容。它还需要训练有素的数据文件来支持旧式引擎,例如tessdata存储库中的文件。

Tesseract具有Unicode(UTF-8)支持,并且可以“开箱即用”地识别100多种语言。

Tesseract支持多种输出格式:纯文本,hOCR(HTML),PDF,仅不可见文本的PDF,TSV。master分支还对ALTO(XML)输出提供了实验性支持。

安装Tesseract:

您可以通过预建的二进制软件包安装正方体 或从源代码编译它。
支持的编译器是:
GCC 4.8及以上
lang 3.4及以上
MSVC 2015、2017、2019年
其他编译器可能可以工作,但未得到官方支持。
付费服务
模板/插件

联系客服

手机版

扫一扫进入手机版

返回顶部