Python爬虫利用18行代码爬取虎牙上百张小姐姐图片

您所在的位置:网站首页 虎牙s11小姐姐 Python爬虫利用18行代码爬取虎牙上百张小姐姐图片

Python爬虫利用18行代码爬取虎牙上百张小姐姐图片

2023-04-01 12:15| 来源: 网络整理| 查看: 265

Python爬虫利用18行代码爬取虎牙上百张小姐姐图片

下面开始上代码

需要用到的库

import request #页面请求 import time #用于时间延迟 import re #正则表达式内容提取

构造请求头,这个要说明一下,有的网站不需要这个,但是虎牙需要,要不然就会给你返回错误码,大家可以试试,这是最基本的防反爬虫手段 至于怎么搞来的,按下f12然后去复制就可以了,详细可以问度娘请求头怎么做

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0"}

定义一个变量response 来接收请求到的网页,注意用request是返回的状态码所以要定义html变量。 然后用变量 html接收网页源代码

response = requests.get(headers=headers, url="https://www.huya.com/g/1663") html = response.text

下面要用正则表达式了

urls = re.findall('


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3