python最新官网图片

您所在的位置:网站首页 图片爬虫官网 python最新官网图片

python最新官网图片

2023-04-07 16:36| 来源: 网络整理| 查看: 265

python最新官网图片_Python轻松爬取Rosimm写真网站全部图片 思创斯忠实用户-ss • 2023年2月14日 18:15 • Python

python最新官网图片_Python轻松爬取Rosimm写真网站全部图片RosimmImage有图有真相defmain_start(url):”””爬虫入口,主要爬取操作”””try:r=requests.get(url+’.html’,headers=HEADERS,timeout=10).textprint(url+’.html’)name_index=0#套图名,也作为文件夹名folder_name=BeautifulSoup(r,’lxm…

大家好,我是你的好朋友思创斯。今天说一说python最新官网图片_Python轻松爬取Rosimm写真网站全部图片,希望您对编程的造诣更进一步.

RosimmImage

942621-20180704090305137-1532496093.jpg

有图有真相

942621-20180704090314134-2145846698.png

def main_start(url):

“””

爬虫入口,主要爬取操作

“””

try:

r = requests.get(url+’.html’, headers=HEADERS, timeout=10).text

print(url+’.html’)

name_index = 0

# 套图名,也作为文件夹名

folder_name = BeautifulSoup(r, ‘lxml’).find(

‘h1′,class_=’article-title’).find(‘a’).text.encode(‘ISO-8859-1’).decode(‘utf-8’)

with lock:

if make_dir(folder_name):

# 套图张数

max_count = BeautifulSoup(r, ‘lxml’).find(

‘div’,class_=’pagination2′).find_all(‘li’)[-2].find(‘a’).get_text()

print(‘——-max_count—–‘+max_count)

# 套图页面

page_urls=[]

for i in range(1,(int(max_count)+1)):

if i==1:

page_urls.append(url + ‘.html’)

else:

page_urls.append(url + ‘_’ + str(i)+’.html’)

# 图片地址

for index, page_url in enumerate(page_urls):

print(‘—–page_url—–‘+page_url)

result = requests.get(

page_url, headers=HEADERS, timeout=10).text

img_url=BeautifulSoup(result,’lxml’).find(‘article’,class_=’article-content’).find_all(‘img’)

for s_img_url in img_url:

real_img=’http://www.rosimm8.com’+s_img_url.get(‘src’)

print(‘—–real_img—–‘+real_img)

name_index=name_index+1

save_pic(real_img,name_index)

except Exception as e:

print(e)

仅供学习参考使用

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

文章由思创斯整理,转载请注明出处:https://ispacesoft.com/92602.html

最新 赞 (0) 思创斯忠实用户-ss思创斯忠实用户-ss 0 0 生成海报


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3