当前位置:网站首页>Tess4J OCR简单使用教程
Tess4J OCR简单使用教程
2022-08-08 17:25:00 【51CTO】
Tess4J简介
Tesseract-OCR支持中文识别,并且开源和提供全套的训练工具,是快速低成本开发的首选。而Tess4J则是Tesseract在Java PC上的应用。在英文和数字识别中性能还是不错的,但是在中文识别中,无论速度还是识别率还是较弱,建议有条件的话,针对场景进行训练,会获得较好结果,本文仅对目前Tess4J的用法进行介绍。
使用教程
1.去Tess4J官网下载源码包
前往:Tess4J 官网下载最新的Tess4J的源码包,其中包含Java代码,jar,dll等,大概结构如下:
image
2.创建Java项目并配置
网上不少文章会提到DLL,其实在最新的版本,如果源码包里面有dist路径,则只需要配置该jar包和lib中相关的jar即可。
注意点1:将dist/tess4j-3.4.0.jar 及 lib/*.jar加入项目
注意点2:tessdata一定要配置到根目录,否则需要在代码中指定dataPath
注意点3:无需将源码包拷贝到项目中,可能会出错
所以最终的目录结构如下:
3.尝试写一个Demo
可以按照官网的示例,直接编写一个Demo试一下效果:
其中注意三处:
- tessdata放在与src同级的根目录下,否则需要指定dataPath
- 如果需要识别英文之外的语种,需要指定识别语种;
- 其他语种下载地址:其他语种下载地址
边栏推荐
猜你喜欢
随机推荐
leetcode:296.最佳的碰头地点
软件工程基础知识--认识软件工程
MySQL 表的增删查改
数据库分析与优化
彻底理解 volatile 关键字及应用场景,面试必问,小白都能看懂!
L2-024 部落 (25 分)(并查集)
Are Huishang Futures official and reliable?Is it safe to open an account in Huishang Futures?
对于端口的粗浅理解
开源一夏 | 疫情期间闲来无事,我自制了一个按钮展示框特效来展示我的博客
【云图说】第252期 初识云速建站服务
H. Huge Boxes of Animal Toys
Nervegrowold: machine advanced learning advice
L2-017 人以群分 (25 分)
Detailed explanation of JVM memory model and structure (five model diagrams)
Mysql都有那些最需要掌握的原理?
Qt——选择文件夹并获取路径以及文件夹下子文件
企业“数字化转型”成功的2个必备条件!
套接字的概念
DSPE-PEG-FITC,Fluorescein-PEG-DSPE,修饰性PEG磷脂-聚乙二醇-荧光素
史上最强IDEA工具使用教程,你想要的全都有!