Qdata模块

您所在的位置:网站首页 python爬取百度指数 Qdata模块

Qdata模块

2023-08-10 22:29| 来源: 网络整理| 查看: 265

在Github上看到一个有趣的第三方模块Qdata,可以根据关键词获取百度指数、百度搜索指数,还有天眼查搜索公司数据的功能。

百度指数

百度指数是以百度海量网民行为数据为基础的数据分析平台。百度指数主要功能模块有基于关键词的趋势研究、需求图谱和人群画像,也可以多个词进行对比分析。通过查询某个关键词的百度指数,可以知道该词在百度的搜索热度有多高,在一段时间内的搜索涨跌态势以及相关的资讯舆论变化,哪些群体关注这个词,同时还有展示相关的词。

查询百度指数 输入“北京”关键词搜索(链接) 在这里插入图片描述输入“北京”,点击开始探索 在这里插入图片描述 可以看到有趋势研究、需求图谱、人群画像三个模块可以选择,上面显示的是一段时间内每日百度搜索指数趋势研究,可以通过拖动时间轴查询过往更久的的搜索指数。页面下还有一段时间内的日均值,资讯指数等,这里就不介绍了,感兴趣的伙伴们可以自己上去玩玩。 Qdata

下面正式进入正题,Qdata是一个Python SDK 提供查询百度搜索指数调用,下面就来安装使用~

pip 安装qdata pip install qdata

获取自己的cookie 登录百度账号后,打开百度首页,打开开发者页面(F12键或鼠标右键->检查): 点击应用程序->Cookie->点击www.baidu.com->右边Name一栏找到BDUSS,对应的value就是你的cookie。 cookie = ‘BDUSS=XXXX(你的cookie序列)’,一定要加上BDUSS=这个前缀,不然程序报错。

get baidu index

import pandas as pd from qdata.baidu_index import get_search_index cookie = 'BDUSS=xxxx(你的cookie序列)' keywords_list = [['北京']] start_date = '2020-04-01' end_date = '2020-04-20' res_list = list(get_search_index(keywords_list=keywords_list, start_date=start_date, end_date=end_date, cookies=cookie)) pd.DataFrame(res_list).head()

在这里插入图片描述

还可以一次查询多个关键词的百度指数(最多五个):

import pandas as pd from qdata.baidu_index import get_search_index cookie = 'BDUSS=xxxx(你的cookie序列)' keywords_list = [['北京'], ['故宫'], ['北京小吃']] start_date = '2020-04-01' end_date = '2020-04-20' res_list = list(get_search_index(keywords_list=keywords_list, start_date=start_date, end_date=end_date, cookies=cookie)) pd.DataFrame(res_list).tail()

在这里插入图片描述

qdata模块还有资讯指数、天眼查查询的功能,感兴趣的伙伴可以自行试一下~



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3