python最新官网图片 |
您所在的位置:网站首页 › 图片爬虫官网 › python最新官网图片 |
python最新官网图片_Python轻松爬取Rosimm写真网站全部图片
思创斯忠实用户-ss • 2023年2月14日 18:15 • Python python最新官网图片_Python轻松爬取Rosimm写真网站全部图片RosimmImage有图有真相defmain_start(url):”””爬虫入口,主要爬取操作”””try:r=requests.get(url+’.html’,headers=HEADERS,timeout=10).textprint(url+’.html’)name_index=0#套图名,也作为文件夹名folder_name=BeautifulSoup(r,’lxm… 大家好,我是你的好朋友思创斯。今天说一说python最新官网图片_Python轻松爬取Rosimm写真网站全部图片,希望您对编程的造诣更进一步. RosimmImage ![]() 有图有真相 ![]() def main_start(url): “”” 爬虫入口,主要爬取操作 “”” try: r = requests.get(url+’.html’, headers=HEADERS, timeout=10).text print(url+’.html’) name_index = 0 # 套图名,也作为文件夹名 folder_name = BeautifulSoup(r, ‘lxml’).find( ‘h1′,class_=’article-title’).find(‘a’).text.encode(‘ISO-8859-1’).decode(‘utf-8’) with lock: if make_dir(folder_name): # 套图张数 max_count = BeautifulSoup(r, ‘lxml’).find( ‘div’,class_=’pagination2′).find_all(‘li’)[-2].find(‘a’).get_text() print(‘——-max_count—–‘+max_count) # 套图页面 page_urls=[] for i in range(1,(int(max_count)+1)): if i==1: page_urls.append(url + ‘.html’) else: page_urls.append(url + ‘_’ + str(i)+’.html’) # 图片地址 for index, page_url in enumerate(page_urls): print(‘—–page_url—–‘+page_url) result = requests.get( page_url, headers=HEADERS, timeout=10).text img_url=BeautifulSoup(result,’lxml’).find(‘article’,class_=’article-content’).find_all(‘img’) for s_img_url in img_url: real_img=’http://www.rosimm8.com’+s_img_url.get(‘src’) print(‘—–real_img—–‘+real_img) name_index=name_index+1 save_pic(real_img,name_index) except Exception as e: print(e) 仅供学习参考使用 版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。文章由思创斯整理,转载请注明出处:https://ispacesoft.com/92602.html 最新 赞 (0)![]() |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |