专栏名称: 编程派
Python程序员都在看的公众号,跟着编程派一起学习Python,看最新国外教程和资源!
目录
相关文章推荐
51好读  ›  专栏  ›  编程派

验证码识别100%?我飘了...

编程派  · 公众号  · Python  · 2020-11-28 11:40

正文

请到「今天看啥」查看全文


这里我先给出github项目地址,如果方便,可以给我个star⭐️!

https://github.com/hellokuls/cnnyzm

1.熟悉项目结构

这里我给大家都标识出来了,首先你需要了解每个文件是干什么的,不然你就会像只无头苍蝇。

这里的每一个文件都很重要。

2. 使用前的准备

使用之前是需要你准备好你的数据集, 那么怎么准备呢?

如果你是需要爬取A网站,那么你可以通过第三方库生成与A网站相同的验证码图片

你也可以直接爬取它的图片

但是我们需要注意的是,图片的命名中必须要有相对应的字母或者数字。

例如我上面这样

所以最好还是自己去生成对应的验证码。

数量集需要多少呢?

我每次训练都是使用了1万张以上的照片

基本的准备好了,我们如何来使用该项目呢?

3.修改项目

没错,确实需要修改

修改什么?

你的图片路径以及你的命名规则。

像上图这些地方,肯定是需要修改的。







请到「今天看啥」查看全文