最新推荐
-
创建SQlite数据库小工具v1.0绿色版 编程开发 / 385KB
-
FameView组态软件管理器7.6.11官方版 编程开发 / 64M
-
-
暗巷APK反编译多功能工具箱v1.1绿色版 编程开发 / 17.1M
-
精品推荐
-
ShopEX ECstorev2.3.8源码完整版 编程开发 / 33M
查看 -
EyouCms(易优企业建站系统)v1.4.9官方版 编程开发 / 26.1M
查看 -
jdk1.6 api 中文版 chm版 编程开发 / 34.7M
查看 -
Keil C51(51单片机编程软件)v9.01中文汉化版 编程开发 / 33.6M
查看 -
Apifox(接口调试工具)v1.4.12官方版 编程开发 / 90.4M
查看
本类排行
详情介绍
借助jTessBoxEditor软件,可以提高Tesseract-OCR文本识别的准确性。通过jTessBoxEditor的不断训练,Tesseract-OCR文本识别的准确率得到了很大的提高。
借助jTessBoxEditor软件,可以提高Tesseract-OCR文本识别的准确性。通过jTessBoxEditor的不断训练,Tesseract-OCR文本识别的准确率得到了很大的提高。
指示
jTessBoxEditor的运行环境是JAVA虚拟机,是teeesseract智能图像识别软件的训练框架。无需安装,直接解压即可。不过必须提前安装一个jar包jdk-8u101-windows-x64虚拟机。
用jTessBoxEditor自动训练3500常用汉字
打开jTessBoxEditor图形界面
(1) 单击TIFF/BoxGenerator 按钮
(2)复制3500个汉字到空白处
(3)选择文件夹:(随便命名一个文件夹,我的是在F盘)
(4)命名(随意命名,比如我的是哈哈)
(5)选择自己的医学训练字体(比如我的是宋朝9pt)
(6)然后点击Generate按钮生成tif和box文件
(7) 单击训练器按钮
(8)打开之前创建的文件夹
(9)语言需要重命名(改成和步骤4一样的名字,我的是哈哈)
(10)选择已有箱的列车
(11)然后点击运行
(12)成功后: