当前位置:网站首页>Tess4J OCR简单使用教程
Tess4J OCR简单使用教程
2022-08-08 17:25:00 【51CTO】
Tess4J简介
Tesseract-OCR支持中文识别,并且开源和提供全套的训练工具,是快速低成本开发的首选。而Tess4J则是Tesseract在Java PC上的应用。在英文和数字识别中性能还是不错的,但是在中文识别中,无论速度还是识别率还是较弱,建议有条件的话,针对场景进行训练,会获得较好结果,本文仅对目前Tess4J的用法进行介绍。
使用教程
1.去Tess4J官网下载源码包
前往:Tess4J 官网下载最新的Tess4J的源码包,其中包含Java代码,jar,dll等,大概结构如下:
image
2.创建Java项目并配置
网上不少文章会提到DLL,其实在最新的版本,如果源码包里面有dist路径,则只需要配置该jar包和lib中相关的jar即可。
注意点1:将dist/tess4j-3.4.0.jar 及 lib/*.jar加入项目
注意点2:tessdata一定要配置到根目录,否则需要在代码中指定dataPath
注意点3:无需将源码包拷贝到项目中,可能会出错
所以最终的目录结构如下:
3.尝试写一个Demo
可以按照官网的示例,直接编写一个Demo试一下效果:
其中注意三处:
- tessdata放在与src同级的根目录下,否则需要指定dataPath
- 如果需要识别英文之外的语种,需要指定识别语种;
- 其他语种下载地址:其他语种下载地址
边栏推荐
猜你喜欢
随机推荐
新版松鼠as换源操作
Tensorflow教程(二)——基本概念与搭建流程
linux安装部署redis&配置远程连接
Tensorflow教程(六)——变量基础操作
字节一面:TCP 和 UDP 可以使用同一个端口吗?
【NodeJs篇】fs文件系统模块
开源一夏 | 疫情期间闲来无事,我自制了一个按钮展示框特效来展示我的博客
永续合约交易所系统开发逻辑详情
中金证券股票开户流程是什么,我需要准备身份证吗,安全吗
Regular use in js
差分约束做法
How to set timed network disconnection to assist self-discipline in win10
【云图说】第252期 初识云速建站服务
L2-016 愿天下有情人都是失散多年的兄妹 (25 分)
Solve the inexplicable problem of MySQL violently - restart the service!
The difference between rv and sv
How banner displays drawable images
DSPE-PEG-FITC,Fluorescein-PEG-DSPE,修饰性PEG磷脂-聚乙二醇-荧光素
【数学模型】灰色关联分析
leetcode:313. 超级丑数