Python爬虫利用18行代码爬取虎牙上百张小姐姐图片 |
您所在的位置:网站首页 › 虎牙s11小姐姐 › Python爬虫利用18行代码爬取虎牙上百张小姐姐图片 |
Python爬虫利用18行代码爬取虎牙上百张小姐姐图片
下面开始上代码 需要用到的库 import request #页面请求 import time #用于时间延迟 import re #正则表达式内容提取构造请求头,这个要说明一下,有的网站不需要这个,但是虎牙需要,要不然就会给你返回错误码,大家可以试试,这是最基本的防反爬虫手段 至于怎么搞来的,按下f12然后去复制就可以了,详细可以问度娘请求头怎么做 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0"}定义一个变量response 来接收请求到的网页,注意用request是返回的状态码所以要定义html变量。 然后用变量 html接收网页源代码 response = requests.get(headers=headers, url="https://www.huya.com/g/1663") html = response.text下面要用正则表达式了 urls = re.findall(' |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |