当前位置:网站首页>Tess4J OCR简单使用教程
Tess4J OCR简单使用教程
2022-08-08 17:25:00 【51CTO】
Tess4J简介
Tesseract-OCR支持中文识别,并且开源和提供全套的训练工具,是快速低成本开发的首选。而Tess4J则是Tesseract在Java PC上的应用。在英文和数字识别中性能还是不错的,但是在中文识别中,无论速度还是识别率还是较弱,建议有条件的话,针对场景进行训练,会获得较好结果,本文仅对目前Tess4J的用法进行介绍。
使用教程
1.去Tess4J官网下载源码包
前往:Tess4J 官网下载最新的Tess4J的源码包,其中包含Java代码,jar,dll等,大概结构如下:
image

2.创建Java项目并配置
网上不少文章会提到DLL,其实在最新的版本,如果源码包里面有dist路径,则只需要配置该jar包和lib中相关的jar即可。
注意点1:将dist/tess4j-3.4.0.jar 及 lib/*.jar加入项目
注意点2:tessdata一定要配置到根目录,否则需要在代码中指定dataPath
注意点3:无需将源码包拷贝到项目中,可能会出错
所以最终的目录结构如下:

3.尝试写一个Demo
可以按照官网的示例,直接编写一个Demo试一下效果:
其中注意三处:
- tessdata放在与src同级的根目录下,否则需要指定dataPath
- 如果需要识别英文之外的语种,需要指定识别语种;
- 其他语种下载地址:其他语种下载地址
边栏推荐
猜你喜欢

4. S32K14X study notes: S32 Design Studio new and imported projects

【数学模型】TOPSIS

以数治企,韧性成长,2022 年中国 CIO 数字峰会成功举行

Cholesterol-PEG-DBCO,CLS-PEG-DBCO,胆固醇-聚乙二醇-二苯基环辛炔一种环炔烃

信号生成和可视化

Cuda Anaconda tensorflow 版本对应

正则在js中的使用

1.初识MySQL数据库

【NodeJs篇】fs文件系统模块

VISTA无人驾驶模拟器;FinRL量化金融深度强化学习库;『深度神经网络应用』电子书;CUDA/TensorRT案例集锦;前沿论文 | ShowMeAI资讯日报
随机推荐
爬百度图片
2.MySQL链接和创建数据库,创建数据表
测试/开发程序员停滞不前,倦怠怎么办?突破各种失败和挫折......
Solve the inexplicable problem of MySQL violently - restart the service!
XDOJ - count the number of positive integers
leetcode:306. 累加数
dp, dpi, px knowledge supplement
leetcode:294.翻转游戏
arxiv国内镜像——快速下载
R file not found problem
Cholesterol-PEG-DBCO,CLS-PEG-DBCO,胆固醇-聚乙二醇-二苯基环辛炔一种环炔烃
转载,fragment讲的很好的大佬
R文件找不到问题
mysql中模糊查询的四种用法介绍
对于端口的粗浅理解
Qt——选择文件夹并获取路径以及文件夹下子文件
10 种最佳 IDE 软件 ,你更忠爱哪一个?
yarn : 无法加载文件 D:xxx\node_global\yarn.ps1 因为在此系统上禁止运行脚本
1.初识MySQL数据库
3531. 哈夫曼树