文章目录
策略源码结果引用
奥密克戎比原先的设想要凶猛的多,抢退烧药,抢口罩,抢抗原,现在要抢血氧仪,实际上我是没抢上啥/(ㄒoㄒ)/~~,超前意识太单薄,但愿大家都能平稳度过这一关吧。
血氧仪现在也是抢破头,标称现货的一周发出来就不错了,算了,不抢了。用点爬虫技术爬一爬,看看都是啥。
策略
在平台主页上搜索一下血氧仪,马上就列出了一堆产品,很多页,通过分析网页地址找到规律,可以由python自动访问。商品信息的提取,这里还是简单使用字符串函数来处理,确实太low,效率也低。
源码
部分源码,隐去涉及的版权问题部分o(╥﹏╥)o
import requests
import re
import time
goods = '血氧仪'
pre_url = 'https://xxxxxxxxxx/Search?keyword=' + goods + '&qrst=1&wq=' + goods + '&stock=1&pvid=46acaecdac14432e93eb3cb00fe8abfd&cid3=12587&cid2=9197'
headers = {'User-Agent':
'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:94.0) Gecko/20100101 Firefox/94.0'}
for p in range(1, 5):
url = pre_url + '&page=' + str(2 * p - 1) + '&s=' + str((p - 1) * 60 + 1) + '&click=0'
html = requests.get(url, headers=headers) # Get方式获取网页数据
strHtml = html.text
# print(strHtml)
try:
plt = re.findall(r'¥')[3].split(' |