爬取斗图吧表情包

您所在的位置:网站首页 绿帽子斗图表情包 爬取斗图吧表情包

爬取斗图吧表情包

2024-07-16 08:05| 来源: 网络整理| 查看: 265

爬取斗图吧表情包 原创

Python爬虫案例 2023-10-26 11:55:16 ©著作权

文章标签 图吧 公众号 微信 文章分类 Python 后端开发

©著作权归作者所有:来自51CTO博客作者Python爬虫案例的原创作品,请联系作者获取转载授权,否则将追究法律责任

用python获取斗图吧表清包

微信关注公众号回复 斗图吧 获取源代码

看效果

爬取斗图吧表情包_图吧

打开网站

点击系列表情包

然后随便点击一个

爬取斗图吧表情包_微信_02

然后打开开发者模式

找到该段代码

爬取斗图吧表情包_微信_03

一个是表情包名称

还有一个是src属性

属性值是表情包的url地址

所以先从这个网页中获取表情包的名称和表情包的url地址

然后再进行下载保存

进行访问

注意要加上referer防盗链,因为表情包的地址设置了防盗链,如果不设置,就访问下载不了

url = 'https://www.doutub.com/series_lists/details/p5bdhifn5WEW3JXjDz8ReaED' headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36 Edg/111.0.1661.54', 'referer': 'https://m.doutub.com/' } response = requests.get(url=url,headers=headers).text

提取信息

img_url = re.findall('.*?',response) title = re.findall('

(.*?)

',response) # print(title)

下载保存

for i in img_url[1:]: img_name = re.sub(rstr,"", title[a]) a+=1 print(i) content = requests.get(url=i,headers=headers).content with open(f'斗图网/{img_name}.jpg',mode='wb') as f: f.write(content) print('保存完成!')

微信关注公众号回复 斗图吧 获取源代码

收藏 评论 分享 举报

上一篇:爬取a站视频,m3u8案例,acfun

下一篇:用python查询12306车票,一件获取所有车次信息



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3