Tesseract 4 新增了一个基于神经网络 (LSTM) 的OCR 引擎,该引擎专注于线条识别,但仍然支持 Tesseract 3 的旧版 Tesseract OCR 引擎,该引擎通过识别字符模式来工作。使用旧版 OCR 引擎模式 (--oem 0) 可启用与 Tesseract 3 的兼容性。它还需要支持旧版引擎的训练数据文件,例如来自tessdata存储库的文件。

相关导航

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注