美文网首页
8.使用tesseract识别验证码初探

8.使用tesseract识别验证码初探

作者: starrymusic | 来源:发表于2019-04-01 15:03 被阅读0次

在我的电脑上是这样的:

我将tesseract安装在了D盘,然后将文件夹路径加入到环境变量里:

然后将要被识别的图片放在某个文件夹下:

在cmd里先切换盘符到图片存放的文件夹路径,然后使用tesseract做识别:

前一个ceshi2.png是要识别的图片,后一个ceshi2是将识别后的文字保存为TXT文档,然后就可以看到存放图片的文件夹下多了一个文件,打开看下,识别的蛮准的:

如果用同样的方式去识别中文字符就会失败,因为用默认英文去识别中文字符,很显然不会成功,这时就需要切换语言了:

-l是切换语言的命令,chi_sim是简体中文包,全称是“chi_sim.traineddata”:

识别结果如下:

对于简单的图片,没有线条干扰的,准确率还是挺高的,对于有线条干扰的,有好多背景的识别准确率较低。

相关文章

网友评论

      本文标题:8.使用tesseract识别验证码初探

      本文链接:https://www.haomeiwen.com/subject/mnsvbqtx.html