【Python网络爬虫】获取cookie的方法

您所在的位置：网站首页 › app读取浏览器cookie › 【Python网络爬虫】获取cookie的方法

【Python网络爬虫】获取cookie的方法

2024-07-11 00:32| 来源: 网络整理| 查看: 265

一、手动获取 1.通过浏览器打开网站 2.网页右键检查或F12 3.右上找到网络或network 4.在xhr下，重新刷新网页 5.左键名称下的链接，右侧弹出中headers（标头）中存在cookie

二、requsets获取 import requests def fun_1(): """方式一：CookieJar""" # province省份，creditcode统一社会信用代码，company市场主体(企业名字)，cpmc地理标志(特产)， url_search = 'https://dlbzsl.hizhuanli.cn:8888/Logo/Result?cpmc=' + '五常大米' + '&company=&creditcode=' res = requests.get(url_search) cookiejar = res.cookies cookies = requests.utils.dict_from_cookiejar(cookiejar) print(cookiejar) print(cookies)

三、Session获取 import requests def fun_2(): """方式二：Session""" session = requests.Session() # province省份，creditcode统一社会信用代码，company市场主体(企业名字)，cpmc地理标志(特产)， url_search = 'https://dlbzsl.hizhuanli.cn:8888/Logo/Result?cpmc=' + '五常大米' + '&company=&creditcode=' cookies = session.get(url_search).cookies.get_dict() print(cookies)

四、selenium获取 from selenium import webdriver def fun_3(): # province省份，creditcode统一社会信用代码，company市场主体(企业名字)，cpmc地理标志(特产)， url_search = 'https://dlbzsl.hizhuanli.cn:8888/Logo/Result?cpmc=' + '五常大米' + '&company=&creditcode=' # 无头浏览 option = webdriver.ChromeOptions() option.add_argument("headless") chrome_path = r'C:\Users\lenovo\PycharmProjects\爬虫示例代码\获取cookie\chromedriver.exe' browser = webdriver.Chrome(options=option) browser.get(url_search) # 延迟10秒 time.sleep(10) cookies = browser.get_cookies() print(cookies) print('ASP.NET_SessionId的值:', cookies[0].get('value')) # 关闭浏览器 browser.close()

五、其他示例代码 import requests url = 'https://www.processon.com/login' login_email = '[email protected]' login_password = 'ZZZ0' # 创建一个session,作用会自动保存cookie session = requests.session() data = { 'login_email': login_email, 'login_password': login_password } # 使用session发起post请求来获取登录后的cookie,cookie已经存在session中 response = session.post(url = url,data=data) # 用session给个人主页发送请求，因为session中已经有cookie了 index_url = 'https://www.processon.com/diagrams' index_page = session.get(url=index_url).text print(index_page)

参考链接：

爬虫——cookie模拟登陆

爬虫之模拟登录、自动获取cookie值、验证码识别_小狐狸梦想去童话镇的博客-CSDN博客_go爬虫自动识别验证码登陆

爬虫中获取cookie的方式 - 程序员一学徒 - 博客园 (cnblogs.com)

利用requests库获取cookie的两种方式_龙王.*?的博客-CSDN博客_requests查看cookie

【本文地址】

【Python网络爬虫】获取cookie的方法

【Python网络爬虫】获取cookie的方法

今日新闻

推荐新闻