2021最新 python爬取12306列车信息自动抢票并自动识别验证码(三)购票篇 |
您所在的位置:网站首页 › 飞鸽互联忘了密码怎么办 › 2021最新 python爬取12306列车信息自动抢票并自动识别验证码(三)购票篇 |
项目前言
tiebanggg又来更新了,项目——【12306-tiebanggg-master】注:本项目仅供学习研究,如若侵犯到贵公司权益请联系我第一时间进行删除;切忌用于一切非法途径,否则后果自行承担! 项目描述通过分析123O6,车次列表信息无需登录即可获取,但是如果我们想要使用代码代替手动为自己进行购票时,则需要进行登录网站;为了不给对方服务器造成压力,本项目并未开启多线程。项目为全自动进行车票的购买,包括(登录、验证码识别、刷票、判断是否有票、预购、下单、邮箱通知)本项目思路——使用selenium登录网站获取到cookie(供后续购票使用),定时检查cookie是否有效,获取列车列表信息及购票流程均使用requests的方式进行。 之前我们学习了如何获取与到列车信息数据以及selenium登录篇,本篇将讲解【购票流程】。如果没有看过之前的文章请移步: python爬取12306列车信息自动抢票并自动识别验证码(一)列车数据获取篇 python爬取12306列车信息自动抢票并自动识别验证码(二)selenium登录验证篇 本项目结构如图: 本项目思路、过程过于复杂,共分为【列车数据获取篇】【selenium登录验证篇】【购票下单篇】【项目结束】,本篇文章只讲第三点【购票下单篇】 涉及到的第三方包: ① lxml ② requests ③ lxmll 一. 抓包并编写相应函数本次“幸运”对象地址:aHR0cHM6Ly93d3cuMTIzMDYuY24vaW5kZXgvaW5kZXguaHRtbA== 1. 抓包 ①搜先进入车票搜索页面进行车票检索,选一个车次点击预定进行抓包 可以看到secretStr类似加密的东西,这里细心的同学应该会发现和我们第一篇获取到的列车信息中返回的字段有些类似,其他的参数不过多介绍分别出发日期、出发地址等这些基本信息: secretStr: 03Z6dtSr5ZfgGUZR9R3nOVDdAwVdRhTaTfZ1/Q5qbxA+TG8Wm9jS7UhSR2AFHT8Wrmbx3DLwtgJ2 tQHWoFcQ2rhg93EbGiVF2DPqDFSOzf96DX7U7uxitG7FZHce7iLWpqJerbacxAWRQ7BZPDF8mOcf f9QOdt/tipR8/ZB8S89haCQR/K6ahIwtagRAC8AquzW8kXmi6Bp4CG+8CCY5Z3NsYOLfESCD0Paz GJonq72dLRG/+MBWj626UAMLxSY6J8xaLeqI+Ct3G8mPv9tWhSMYJAywb195JqLFLMcGTkDBXeKq yTr3GpSmgnc= 可以看到基本上一致,但是他们并不相等,列车信息返回的字符串中包含有%2F、%2B、%0A、%3D等字符而secretStr中却没有,根据经验判断这些字符是通过url编码而成,我们拿两条字符串的最后几位进行对比(Tr3GpSmgnc%3D : Tr3GpSmgnc=)发现最后一个字符‘=’变成了%3D,这里将%3D放入工具进行解码看看: 得到参数后编写出submit函数: def submit(self, res, cookies, read_id, item): url = "https://kyfw.12306.cn/otn/leftTicket/submitOrderRequest" data = { 'secretStr': res, 'train_date': variable.date, 'back_train_date': variable.date, 'tour_flag': 'dc', 'purpose_codes': 'ADULT', 'query_from_station_name': read_id[item.split('|')[6]], 'query_to_station_name': read_id[item.split('|')[7]], } setting.headers['User-Agent'] = random.choice(USER_AGENTS) print('[submit]-data:', data) response = self.session.post(url=url, data=data, headers=setting.headers, cookies=cookies) try: messages = json.loads(response.text)['messages'] print('[submit]-messages:', messages) print('[submit]-ponse.status_code:', response.status_code) print('[submit]-response.text:', response.text) if len(messages) != 0: if '当前时间不可以订票' in messages[0]: return '当前时间不可以订票' elif '您还有未处理的订单' in messages[0]: return '您还有未处理的订单' elif '提交失败,请重试...' in messages[0]: return '提交失败,请重试...' else: return 'True' else: return 'True'接下来看看getPassengerDTOs这条接口的响应和data参数:
data参数:只有一个REPEAT_SUBMIT_TOKEN,这个token不知道是啥玩意但是看着像md5签名,这里提供思路:1,全局搜索看看服务器是否有返回REPEAT_SUBMIT_TOKEN; 2,搜索JS定位到前面位置,还原签名算法; 接下来编写confirmPassengergetPassengerDTOs函数并返回响应信息userinfo: def confirmPassengergetPassengerDTOs(self, REPEAT_SUBMIT_TOKEN, cookies): url = 'https://kyfw.12306.cn/otn/confirmPassenger/getPassengerDTOs' data = { '_json_att': '', 'REPEAT_SUBMIT_TOKEN': REPEAT_SUBMIT_TOKEN.group(1), } setting.headers['Referer'] = 'https://kyfw.12306.cn/otn/confirmPassenger/initDc' setting.headers['User-Agent'] = random.choice(USER_AGENTS) response = self.session.post(url=url, data=data, headers=setting.headers, cookies=cookies).text userinfo = json.loads(response) print('[confirmPassengergetPassengerDTOs]-userinfo', userinfo) return userinfoOK,下一步选择乘车人,点击提交订单进行抓包:弹出 接下来看看他们的formdata表单: checkOrderInfo 到这已经获取到了所有的表单参数,接下来编写checkOrderInfo函数: def checkOrderInfo(self, userinfo, REPEAT_SUBMIT_TOKEN, cookies): """ :param userinfo: 通过 confirmPassengergetPassengerDTOs函数得到 :param REPEAT_SUBMIT_TOKEN: 通过 initDc函数得到 :param cookies: :return: """ userinfo = userinfo url = "https://kyfw.12306.cn/otn/confirmPassenger/checkOrderInfo" passenger_id_no = userinfo['data']['normal_passengers'][0]['passenger_id_no'] # 身份证 mobile_no = userinfo['data']['normal_passengers'][0]['mobile_no'] # 电话 allEncStr = userinfo['data']['normal_passengers'][0]['allEncStr'] passenger_name = userinfo['data']['normal_passengers'][0]['passenger_name'] # 姓名 data = { 'cancel_flag': '2', 'bed_level_order_num': '000000000000000000000000000000', 'passengerTicketStr': '{},0,1,{},1,{},{},N,{}'.format(variable.play_zuowei_id, passenger_name, passenger_id_no, mobile_no, allEncStr), 'oldPassengerStr': '{},1,{},1_'.format(passenger_name, passenger_id_no), 'tour_flag': 'dc', 'randCode': '', 'whatsSelect': '1', 'sessionId': '', 'sig': '', 'scene': 'nc_login', '_json_att': '', 'REPEAT_SUBMIT_TOKEN': REPEAT_SUBMIT_TOKEN.group(1), } setting.headers['User-Agent'] = random.choice(USER_AGENTS) print('[checkOrderInfo]-data:', data) setting.headers['Referer'] = 'https://kyfw.12306.cn/otn/confirmPassenger/initDc' response = self.session.post(url=url, data=data, headers=setting.headers, cookies=cookies).text print('[checkOrderInfo]-response.text:', response) return [passenger_name, mobile_no, passenger_id_no]再看看getQueueCount这条接口的formdata表单: 当前星期缩写+当前月份缩写可以通过百度得到,得到响应数据后在setting_class.py的variable类中构造字典: # 1-12月英文缩写 yuefen = { '01': 'Jan', '02': 'Feb', '03': 'Mar', '04': 'Apr', '05': 'May', '06': 'Jun', '07': 'Jul', '08': 'Aug', '09': 'Sept', '10': 'Oct', '11': 'Nov', '12': 'Dec', } # 周1-周日英文缩写 xingqi = { '1': 'Mon', '2': 'Tues', '3': 'Wed', '4': 'Thur', '5': 'Fri', '6': 'Sat', '7': 'Sun', }前面initDc函数我们只获取到了REPEAT_SUBMIT_TOKEN,现在只需要再进行leftTicket的提取即可: def initDc(self, cookies): url = 'https://kyfw.12306.cn/otn/confirmPassenger/initDc' data = { '_json_att': '' } setting.headers['User-Agent'] = random.choice(USER_AGENTS) response = self.session.post(url=url, data=data, headers=setting.headers, cookies=cookies) globalRepeatSubmitToken = re.search(r"globalRepeatSubmitToken = '(.*?)'", response.text) print('[initDc]-globalRepeatSubmitToken:', globalRepeatSubmitToken) leftTicket = re.search(r"'leftTicketStr':'(.*?)'", response.text) print('[initDc]-leftTicket:', leftTicket) ticketInfoForPassengerForm) return globalRepeatSubmitToken, leftTicket所有参数获取方式已经得知,现在构造getQueueCount函数: def getQueueCount(self, REPEAT_SUBMIT_TOKEN, leftTicket, item, cookies, train_no, stationTrainCode, train_location): url = "https://kyfw.12306.cn/otn/confirmPassenger/getQueueCount" data = { 'train_date': '{} {} {} {} 00:00:00 GMT+0800 (中国标准时间)'.format( variable.xingqi[self.weekdays(variable.date)], variable.yuefen[variable.date.split('-')[1]], variable.date.split('-')[2], variable.date.split('-')[0]), 'train_no': train_no, 'stationTrainCode': stationTrainCode, 'seatType': '3', 'fromStationTelecode': item.split('|')[6], 'toStationTelecode': item.split('|')[7], 'leftTicket': leftTicket.group(1), 'purpose_codes': '00', 'train_location': train_location, '_json_att': '', 'REPEAT_SUBMIT_TOKEN': REPEAT_SUBMIT_TOKEN.group(1), } setting.headers['User-Agent'] = random.choice(USER_AGENTS) print('[getQueueCount]-data:', data) response = self.session.post(url=url, data=data, headers=setting.headers, cookies=cookies).text print('[getQueueCount]-response.text:', response)接下来点击确认,再次进行下一步抓包: 下面编写confirmSingleForQueue函数: def confirmSingleForQueue(self, userinfo, key_check_isChange, leftTicketStr, REPEAT_SUBMIT_TOKEN, train_location, cookies): """ :param userinfo: 通过 confirmPassengergetPassengerDTOs函数得到 :param key_check_isChange: 通过 initDc函数得到的ticketInfoForPassengerForm字符串,切割处理提取即可 :param leftTicketStr: 通过 initDc函数得到的对象 :param REPEAT_SUBMIT_TOKEN: 通过 initDc函数得到 :param train_location: 通过 secretStr列车字符串得到,切割处理提取即可 :param cookies: :return: """ url = "https://kyfw.12306.cn/otn/confirmPassenger/confirmSingleForQueue" passenger_id_no = userinfo['data']['normal_passengers'][0]['passenger_id_no'] # 身份证 mobile_no = userinfo['data']['normal_passengers'][0]['mobile_no'] # 电话 allEncStr = userinfo['data']['normal_passengers'][0]['allEncStr'] passenger_name = userinfo['data']['normal_passengers'][0]['passenger_name'] # 姓名 data = { 'passengerTicketStr': '{},0,1,{},1,{},{},N,{}'.format(variable.play_zuowei_id, passenger_name, passenger_id_no, mobile_no, allEncStr), 'oldPassengerStr': '{},1,{},1_'.format(passenger_name, passenger_id_no), 'randCode': '', 'purpose_codes': '00', 'key_check_isChange': key_check_isChange.group(1), 'leftTicketStr': leftTicketStr.group(1), 'train_location': train_location, 'choose_seats': '', 'seatDetailType': '000', 'is_jy': 'N', 'encryptedData':'', 'whatsSelect': '1', 'roomType': '00', 'dwAll': 'N', '_json_att': '', 'REPEAT_SUBMIT_TOKEN': REPEAT_SUBMIT_TOKEN.group(1), } setting.headers['User-Agent'] = random.choice(USER_AGENTS) setting.headers['Referer'] = 'https://kyfw.12306.cn/otn/confirmPassenger/initDc' response = self.session.post(url=url, data=data, headers=setting.headers, cookies=cookies).text print("[confirmSingleForQueue]-response.text:", response) if '余票不足' in response: return '余票不足!' else: return 'True'queryOrderWaitTime接口可以忽略,不做介绍,有兴趣的同学可以自行研究。 接下来再看resultOrderForDcQueue接口的formdata表单: 到此抢票项目已经完成%99,剩下的就是邮箱推送通知【项目介绍】篇,会尽快更新给大家。 这里做一下说明情况:本来项目还剩下邮件发送以及cookie服务,但由于目前主要功能——购票已完成,本人最近项目较多,剩下两个章节就不做讲解,但是整个项目源码我会放到github上,小伙伴们可以关注我的公众号回复关键字【12306】获取地址自行下载。在这里给大家说一声抱歉了!谢谢大家的关注! 已完结文章: python爬取12306列车信息自动抢票并自动识别验证码(一)列车数据获取篇 python爬取12306列车信息自动抢票并自动识别验证码(二)selenium登录验证篇 码字不容易,如果本篇文章对你有帮助请点个赞8,谢谢~ 合作及源码获取vx:tiebanggg 【注明来意】 QQ交流群:735418202 需项目【12306-tiebanggg-master】源码请关注微信公众号 : *注:本文为原创文章,转载文章请附上本文链接,谢谢! |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |