Python获取英雄联盟皮肤原画:新手玩家们都懵了!(一)

您所在的位置:网站首页 lol英雄皮肤原画在哪获取的 Python获取英雄联盟皮肤原画:新手玩家们都懵了!(一)

Python获取英雄联盟皮肤原画:新手玩家们都懵了!(一)

2024-05-29 12:31| 来源: 网络整理| 查看: 265

本爬虫是为了经验交流,如果读者需要转载,请注明出处和链接 希望:喜欢博主的读者,可以点个关注~,更多精彩内容请收藏本栏目,不定期添加干货。 代码:如果你订阅了本专栏可以直接私信我,我可以发给你完整的代码。如果没有订阅,但是又想要获取源码的读者搞研究的读者,可以直接添加我的VX(weixin号码:Guprogram) 前言夜太美,爬虫就没那么危险善于利用他人的UA爬虫过程分析网页获取每一位英雄的ID值分析原画网页结语

前言

学习py也有不少时间了,老是忘记写博客,我自己也是很无奈呀!作为会为代码而疯狂的啃书君,我都愧对自己的昵称啦!

看到csdn里面那么多的大佬,数十年如一日,从未停歇,也给了我很多的激励。我也想成为你们的榜样呀!我觉得我骄傲了。

作为喜欢读书的我,也是很喜欢打游戏的,之前看到有人爬王者荣耀的皮肤的,我可是王者荣耀的老玩家了,所以我把英雄联盟给爬了。

哈哈哈,没想到吧!

在本次的爬虫教程的过程中,我也会分享给大家一些简单实用的爬虫小技巧。

夜太美,爬虫就没那么危险

在爬取的时候,不要猛攻嘛~,啊啊。。人家服务器受不了啊。。。

你要学会停顿,克制一点,该 sleep 就 sleep。

趁着人家睡觉的时候,限制防范程度是最低的,能晚点就晚点爬,没有看过凌晨4点的洛杉矶,但是你还可以看到凌晨4点的爬虫呢。

这样你的IP地址才不会容易被封。

善于利用他人的UA

如果你在看别人网站的robots.txt,你就会看到别人的声明,声明什么内容可以爬,什么内容不可以爬。但是,不要忽略了人家的声明,希望给什么搜索引擎爬,比如下面这个

看到没,这个别人定义的robots.txt值得注意的是User-Agent,那么当你在Python构造headers的时候,User-Agent就直接指定它们的robots定义的就好了啊,比如:百度的UA,Google的UA或者是搜狗的UA等等。你再去爬爬看,那叫一个友好啊。

爬虫过程分析网页

通过开发者模式F12,你就会发现箭头所指的文件了,没有看到的话,刷新一下试试。

url0 = 'https://game.gtimg.cn/images/lol/act/img/js/heroList/hero_list.js' try: response = requests.get(url0, headers=headers) response.raise_for_status() response.encoding = response.apparent_encoding # 设置编码格式 hreolist = response.json() # 将Response转换成json格式 print(hreolist) # 打印出英雄列表 print(len(hreolist[


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3