python爬虫破解验证码的两种方式(selenium和后台js破解)

您所在的位置:网站首页 破解网页登录验证码 python爬虫破解验证码的两种方式(selenium和后台js破解)

python爬虫破解验证码的两种方式(selenium和后台js破解)

2023-07-16 06:29| 来源: 网络整理| 查看: 265

第一种方法通过selenium破解登陆问题: 视频教学:https://www.bilibili.com/video/av66011301/ 爬取网站:http://58921.com/ 目标爬取:‘2019年内地票房排行榜’ 在这里插入图片描述 当爬取到第三页时问题就来了: 在这里插入图片描述

必须通过登陆才能访问到后面的数据 1.pip install selenium 2.百度搜索 “Chormedriver” 链接"http://npm.taobao.org/mirrors/chromedriver/"(我用的是chrom) 查看你chrom的版本 在这里插入图片描述 寻找和版本最近的包 在这里插入图片描述 下载win32位(win64也能用) 在这里插入图片描述 下载解压之后放在python下Scripts即可 在这里插入图片描述 暴力破解验证码,直接截屏保存到本地 在这里插入图片描述 截屏这个验证码或者整个屏幕 在这里插入图片描述 将cookie存入session 在这里插入图片描述 在这里插入图片描述

到这里就通过selenium破解了验证码 **隐藏chrom弹窗 在这里插入图片描述

第二种通过js破解验证码: 视频教学网站:https://v.qq.com/x/page/e0888nd8yyy.html?ptag=qqbrowser 在这里插入图片描述

1.获取验证码url(输错账号密码会立即多出一个Js文件) 在这里插入图片描述 双击js文件可以看到返回的数据 在这里插入图片描述 分析url的参数含义 在这里插入图片描述 回调的参数给login 在这里插入图片描述 在这里插入图片描述

13位时间戳(加密过的当前时间) 在这里插入图片描述 删去64就可以获取图片 在这里插入图片描述 如下:

在这里插入图片描述 开始获取验证码 在这里插入图片描述 12306服务器很卡所以爬取时候有可能会出现图片打不开 在这里插入图片描述 多刷新几次或者关闭服务器重来 爬取到验证码要验证才能说点击的验证码是否有用(注意这里的的url和前面爬取验证码的url很相似仅仅就后面一点变) 在这里插入图片描述 将获取的验证码传给检验验证码的url并返回信息 在这里插入图片描述 输入的参数为点击的图片的坐标信息,一张图片一个坐标(x,y)

在这里插入图片描述 ***注意:获取验证码的js文件和检验验证码的Js文件需要多输错两次密码或者刷新验证码才能获取。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3