Python爬虫利用18行代码爬取虎牙上百张小姐姐图片

您所在的位置：网站首页 › 虎牙s11小姐姐 › Python爬虫利用18行代码爬取虎牙上百张小姐姐图片

Python爬虫利用18行代码爬取虎牙上百张小姐姐图片

2023-04-01 12:15| 来源: 网络整理| 查看: 265

下面开始上代码

需要用到的库

import request #页面请求 import time #用于时间延迟 import re #正则表达式内容提取

构造请求头，这个要说明一下，有的网站不需要这个，但是虎牙需要，要不然就会给你返回错误码，大家可以试试，这是最基本的防反爬虫手段至于怎么搞来的，按下f12然后去复制就可以了，详细可以问度娘请求头怎么做

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0"}

定义一个变量response 来接收请求到的网页，注意用request是返回的状态码所以要定义html变量。然后用变量 html接收网页源代码

response = requests.get(headers=headers, url="https://www.huya.com/g/1663") html = response.text

下面要用正则表达式了

urls = re.findall('

【本文地址】

Python爬虫利用18行代码爬取虎牙上百张小姐姐图片

Python爬虫利用18行代码爬取虎牙上百张小姐姐图片

今日新闻

推荐新闻