Python爬虫实战之12306抢票

您所在的位置:网站首页 爬虫软件抢票 Python爬虫实战之12306抢票

Python爬虫实战之12306抢票

2024-07-17 01:29| 来源: 网络整理| 查看: 265

12306抢票 前言一、爬虫是什么?二、使用步骤1.引入库2.爬虫代码3.城市编码4.主程序 总结

前言

提示:用python实现简单的12306余票查询

提示:以下是本篇文章正文内容,下面案例可供参考

一、爬虫是什么?

爬虫一般指网络爬虫。网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。

工具:pycharm+python3.7

二、使用步骤 1.引入库

代码如下(示例):

# -*- coding:utf-8 -*- """ @author 恒仔仔 """ from splinter.browser import Browser from time import sleep import traceback import time, sys import os 2.爬虫代码

代码如下(示例):

class HuoChe(object): """docstring for Train""" driver_name = '' executable_path = '' # 用户名 密码 username = u"12306帐户名" passwd = u"12306密码" # cookies值自己找 # 天津%u5929%u6D25%2CTJP 南昌%u5357%u660C%2CNCG 桂林%u6842%u6797%2CGLZ starts = u"%u5929%u6D25%2CTJP" ends = u"%u5357%u660C%2CNCG" # 时间格式2020-10-09 dtime = u"2020-10-09" # 车次,选择第几趟,0则从上之下依次点击 order = 0 ###乘客姓名 users = [u'乘客名'] ##席位 xb = u"二等座" pz = u"成人票" """网址""" # 12306查询URL ticket_url = "https://kyfw.12306.cn/otn/leftTicket/init" # 12306登录URL login_url = "https://kyfw.12306.cn/otn/login/init" # 我的12306URL initmy_url = "https://kyfw.12306.cn/otn/index/initMy12306" # 购票URL buy = "https://kyfw.12306.cn/otn/confirmPassenger/initDc" login_url = 'https://kyfw.12306.cn/otn/login/init' def __init__(self): self.driver_name = 'chrome' self.executable_path = os.getcwd() + '/chromedriver' print("Welcome To Use The Tool") def login(self): self.driver.visit(self.login_url) # 填充密码 self.driver.fill("loginUserDTO.user_name", self.username) self.driver.fill("userDTO.password", self.passwd) print("等待验证码,自行输入....") while True: if self.driver.url != self.initmy_url: sleep(1) else: break def start(self): self.driver = Browser(driver_name=self.driver_name, executable_path=self.executable_path) self.driver.driver.set_window_size(1400, 1000) self.login() self.driver.visit(self.ticket_url) try: print("购票页面开始....") # 加载查询信息 self.driver.cookies.add({"_jc_save_fromStation": self.starts}) self.driver.cookies.add({"_jc_save_toStation": self.ends}) self.driver.cookies.add({"_jc_save_fromDate": self.dtime}) self.driver.reload() count = 0 if self.order != 0: while self.driver.url == self.ticket_url: self.driver.find_bytext(u"查询").click() count += 1 print("循环点击查询.... 第 %s 次" % count) try: self.driver.find_by_text(u'预订')[self.order - 1].click() except Exception as e: print(e) print("还没开始预订") continue else: while self.driver.url == self.ticket_url: self.driver.find_by_text(u"查询").click() count += 1 print("循环点击查询.... 第 %s 次" % count) try: for i in self.driver.find_by_text(u"预订"): i.click() sleep(1) except Exception as e: print(e) print("还没开始预订 %s " % count) continue print("开始预订....") sleep(1) print("开始选择用户....") for user in self.users: self.driver.find_by_text(user).last.click() print("提交订单....") sleep(1) self.driver.find_by_id('submitOrder_id').click() print("开始选座...") sleep(1.5) print("确认选座....") self.driver.find_by_text('qr_submit_id').click() except Exception as e: print(e) 3.城市编码

12306上的这些城市名与编码一一对应,在浏览器中打开开发者工具(F12)查看详细内容。

cities = { '天津': '%u5929%u6D25%2CTJP', '南昌': '%u5357%u660C%2CNCG', '桂林': '%u6842%u6797%2CGLZ' } 4.主程序 if __name__ == "__main__": train = HuoChe() train.starts = cities[sys.argv[1]] train.ends = cities[sys.argv[2]] train.dtime = sys.argv[3] train.start()

运行代码的脚本命令 python trainticket.py 天津 南昌 2020-10-09

总结

提示:这里对文章进行总结: 例如:以上就是今天要讲的内容,本文仅仅简单介绍了python爬虫的使用。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3