Python爬虫验证码识别

您所在的位置:网站首页 短信验证码来源查询系统 Python爬虫验证码识别

Python爬虫验证码识别

2024-07-12 13:45| 来源: 网络整理| 查看: 265

短信验证码的收发

通常,我们的自动化脚本运行在PC上,例如打开一个网页,然后模拟输入手机号,点击获取验证码,接下来就需要输入验证码了。前三个流程自动化很容易,但验证码发送到手机上了,怎么把它转给PC呢?

自动化验证码的整个收发流程,可以这么实现——当手机接收到一条短信时,自动将这条短信转发至某处,例如转发至一台远程服务器或者直接发给PC,在PC上我们可以通过一些方法获取短信内容并提取验证码,再自动化填充到输入的地方即可。

关键步骤是如下两步:

监听手机收到短信的事件将短信内容转发至指定的位置

这两步缺一不可,而且都需要再手机上完成。思路其实简单,以Android手机为例,如果有Android开发经验,这两个功能实现起来很简单的。

首先如何监听手机接收到的短信呢?在Android开发中,分为三个必要环节。

注册读取短信的权限:在一个Android App中,读取短信需要具备特定的权限,所以需要在Android App的AndroidManifest.xml文件中将读取短信的权限配置好,例如: 注册广播事件:Android有一个基本组件叫BroadcastReceiver,是广播接收者的意思,可以用它来监听来自系统的各种事件广播,例如系统电量不足的广播、系统来电的广播,那系统接收到短信的广播自然也不在话下。这类似于注册一个监听器来监听系统接收到短信的事件。这里我们在AndroidManifest.xml文件中注册一个BroadcastReceiver,叫做SmsReceiver: 实现短信广播的接收:这里就需要真正实现短信接收的逻辑了,只需要实现一个SmsReceiver类,它继承了BroadcastReceiver类,然后实现其onReceive方法即可,其中intent参数里就包含了我们想要的短信内容,实现如下: public class SmsReceiver extents BroadcastReceiver{ @Override public void onReceive(Context context, Intent intent){ Bundle bundle = intent.getExtras(); SmsMessage msg = null; if (null !=bundle){ Object[] smsObj = (Object[]) bundle.get("pdus"); msg = SmsMessage.createFromPdu((bytep[]) object); Log.e("短信号码","" + msg.getOriginationAddress()); Log.e("短信内容","" + msg.getDisplayMessageBody()); Log.e("短信时间","" + msg.getTimestampMillis()); } } }

如此一来,我们便实现了短信的接收。

收到短信之后,发送自然也很简单了,例如服务器提供一个API, 请求该API即可实现数据的发送,Android的一些HTTP请求库就可以实现这个逻辑,例如利用OkHttp构造一个HTTP请求。

有没有现成的解决方案呢?当然,完全可以借助一些开源实现。一个开源软件SmsForwarder,中文叫做短信转发器,其GitHub地址为https://github.com/pppscn/SmsForwarder。它的基本框架如图所示:

working_principle

SmsForwarder的架构非常清晰,可以监听收到短信的事件,获取短信的来源号码、接收卡槽、短信内容、接收时间等,然后将这些内容通过一定的规则转发出去,支持转发到邮箱、企业微信群机器人、企业微信应用、Telegram机器人和Webhook等。

实战演示

使用Flask写一个API, 代码如下:

from flask import Flask, request, jsonify from loguru import logger app = Flask(__name__) @app.route('/sms', methods=['POST']) def receive(): sms_content = request.form.get('content') logger.debug(f'received {sms_content}') return jsonify(status='success') if __name__ == '__main__': app.run(debug=True)

设置一个路由,接收POST请求,然后读取了Request表单的内容,其中content就是短信内容的详情,之后将其打印出来。运行结果如下:

* Serving Flask app 'server' * Debug mode: on WARNING: This is a development server. Do not use it in a production deployment. Use a production WSGI server instead. * Running on Press CTRL+C to quit * Restarting with stat * Debugger is active! * Debugger PIN: 134-109-800

为了方便测试,可以用Ngrok工具将该服务器暴露到公网:

ngrok http 5000

运行之后,可以看到如下结果:

Session Status online Account lxw1973 (Plan: Free) Version 3.8.0 Region Japan (jp) Latency 109ms Web Interface Forwarding -> htt Connections ttl opn rt1 rt5 p50 p90 0 0 0.00 0.00 0.00 0.00

可以看到Ngrok为我们配置了一个公网地址,例如访问https://ecb6-122-143-163-242.ngrok-free.app就相当于访问我们本地的http://localhost:5000服务,这样只需在手机上配置这个地址就可以将数据发送到PC端了。

接下来我们手机上打开SmsForder,添加一个Webhook类型的发送方,设置详情如图所示:

2

其中,我们把WebServer的URL直接设置成刚才Ngrok提供的公网地址,注意要在URL的后面加上sms。接着我们添加一个转发规则。如下图所示:

1

这里我们设置了内容匹配规则,将短信转发到Webhook这个发送方,即发送到我们刚刚搭建的Flask服务器上。添加完成后,可以尝试用另一台手机给当前运行次App的手机发送一个验证码信息,内容如下:

测试验证码65272752,一分钟有效

这时可以发现刚才的Flask服务器接收到了这样的结果,如图所示:

Screenshot 2024-03-31 at 16.09.33

可以看到,发送给手机的验证码信息已经成功由手机发送到PC了,接着便可以对此信息进行解析和处理,然后存入数据库或消息队列。

批量收发

如果有大量手机和手机卡,则可以实现手机的群控处理,例如统一安装短信接收软件、统一配置相同的转发规则,从而接收和处理大量手机号的验证码。如图所示就是一个群控系统:

群控

卡池、猫池

除了上面的方法,当然还有更专业的解决方案,例如用专业的手机卡池、猫池,配以专业的软件设备实现短信监听。如下图所示的设备支持插128张SIM卡,可以同时监听128个手机号的验证码。

卡池

接码平台

卡池、猫池的解决方案成本还是比较高的,而且这些方案其实已经不限于简单接收短信验证码了,就像手机群控系统一般会做手机群控爬虫,卡池也可以用来做4G/5G蜂窝代理,仅仅走短信收发当然也可以,未免有些浪费了。如果不想耗费过多成本,想实现短信验证码的自动化,还有一种方案就是接码平台,其基本思路如下:

平台会维护大量手机号,并可能开放一些API或提供网页供我们调用来获取手机号和查看短信的内容。我们调用API或者爬取网页获取手机号,然后在对应的网站输入该手机号来获取验证码。通过调用API或者爬取网页获取对应手机号的短信内容,并交由爬虫处理。

更多的体验可以在小蜜蜂AI网站获取,网址:https://zglg.work。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3