当前位置:网站首页>Tess4J OCR简单使用教程
Tess4J OCR简单使用教程
2022-08-08 17:25:00 【51CTO】
Tess4J简介
Tesseract-OCR支持中文识别,并且开源和提供全套的训练工具,是快速低成本开发的首选。而Tess4J则是Tesseract在Java PC上的应用。在英文和数字识别中性能还是不错的,但是在中文识别中,无论速度还是识别率还是较弱,建议有条件的话,针对场景进行训练,会获得较好结果,本文仅对目前Tess4J的用法进行介绍。
使用教程
1.去Tess4J官网下载源码包
前往:Tess4J 官网下载最新的Tess4J的源码包,其中包含Java代码,jar,dll等,大概结构如下:
image

2.创建Java项目并配置
网上不少文章会提到DLL,其实在最新的版本,如果源码包里面有dist路径,则只需要配置该jar包和lib中相关的jar即可。
注意点1:将dist/tess4j-3.4.0.jar 及 lib/*.jar加入项目
注意点2:tessdata一定要配置到根目录,否则需要在代码中指定dataPath
注意点3:无需将源码包拷贝到项目中,可能会出错
所以最终的目录结构如下:

3.尝试写一个Demo
可以按照官网的示例,直接编写一个Demo试一下效果:
其中注意三处:
- tessdata放在与src同级的根目录下,否则需要指定dataPath
- 如果需要识别英文之外的语种,需要指定识别语种;
- 其他语种下载地址:其他语种下载地址
边栏推荐
猜你喜欢

Tensorflow教程(四)——MNIST项目入门

Cy5反式环辛烯,TCO-Cy5,Cy5 trans-cyclooctene标记生物分子

Detailed explanation of JVM memory model and structure (five model diagrams)

迁移学习(Transfer Learning)的背景、历史

yarn : 无法加载文件 D:xxx\node_global\yarn.ps1 因为在此系统上禁止运行脚本

win10如何设置定时联网断网辅助自律

以数治企,韧性成长,2022 年中国 CIO 数字峰会成功举行

DSPE-PEG-Biotin,385437-57-0,磷脂-聚乙二醇-生物素用于生物分子的检测和纯化

LeetCode_Binary Tree_Medium_515. Find the maximum value in each tree row

The difference between a uri (url urn)
随机推荐
Solve the inexplicable problem of MySQL violently - restart the service!
L2-021 点赞狂魔 (25 分)
七、jmeter发出请求的逻辑
leetcode:295. 数据流的中位数
L2-017 人以群分 (25 分)
信号生成和可视化
How banner displays drawable images
L2-026 小字辈 (25 分)
DSPE-PEG-FITC,Fluorescein-PEG-DSPE,修饰性PEG磷脂-聚乙二醇-荧光素
使用电脑通过VNC Viewer远程连接树莓派4B
测试/开发程序员停滞不前,倦怠怎么办?突破各种失败和挫折......
【数学模型】灰色关联分析
DSPE-PEG-NH2,DSPE-PEG-amine,474922-26-4,磷脂-聚乙二醇-氨基科研试剂
activemq 消息头、消息体、消息属性
dp, dpi, px knowledge supplement
爬百度图片
企业“数字化转型”成功的2个必备条件!
leetcode:306. 累加数
The difference between rv and sv
L2-028 秀恩爱分得快 (25 分)