python最新官网图片

2023-04-07 16:36| 来源: 网络整理| 查看: 265

python最新官网图片_Python轻松爬取Rosimm写真网站全部图片思创斯忠实用户-ss • 2023年2月14日 18:15 • Python

python最新官网图片_Python轻松爬取Rosimm写真网站全部图片RosimmImage有图有真相defmain_start(url):”””爬虫入口，主要爬取操作”””try:r=requests.get(url+’.html’,headers=HEADERS,timeout=10).textprint(url+’.html’)name_index=0#套图名，也作为文件夹名folder_name=BeautifulSoup(r,’lxm…

大家好，我是你的好朋友思创斯。今天说一说python最新官网图片_Python轻松爬取Rosimm写真网站全部图片,希望您对编程的造诣更进一步.

RosimmImage

有图有真相

def main_start(url):

“””

爬虫入口，主要爬取操作

“””

try:

r = requests.get(url+’.html’, headers=HEADERS, timeout=10).text

print(url+’.html’)

name_index = 0

# 套图名，也作为文件夹名

folder_name = BeautifulSoup(r, ‘lxml’).find(

‘h1′,class_=’article-title’).find(‘a’).text.encode(‘ISO-8859-1’).decode(‘utf-8’)

with lock:

if make_dir(folder_name):

# 套图张数

max_count = BeautifulSoup(r, ‘lxml’).find(

‘div’,class_=’pagination2′).find_all(‘li’)[-2].find(‘a’).get_text()

print(‘——-max_count—–‘+max_count)

# 套图页面

page_urls=[]

for i in range(1,(int(max_count)+1)):

if i==1:

page_urls.append(url + ‘.html’)

else:

page_urls.append(url + ‘_’ + str(i)+’.html’)

# 图片地址

for index, page_url in enumerate(page_urls):

print(‘—–page_url—–‘+page_url)

result = requests.get(

page_url, headers=HEADERS, timeout=10).text

img_url=BeautifulSoup(result,’lxml’).find(‘article’,class_=’article-content’).find_all(‘img’)

for s_img_url in img_url:

real_img=’http://www.rosimm8.com’+s_img_url.get(‘src’)

print(‘—–real_img—–‘+real_img)

name_index=name_index+1

save_pic(real_img,name_index)

except Exception as e:

print(e)

仅供学习参考使用

文章由思创斯整理,转载请注明出处：https://ispacesoft.com/92602.html

python最新官网图片

python最新官网图片

今日新闻

推荐新闻