抖音热搜及话题数据爬虫 |
您所在的位置:网站首页 › 抖音热度话题 › 抖音热搜及话题数据爬虫 |
祝大家元旦快乐 ! 新的一年里, 愿你脱去一身的疲惫,将精神振奋; 忘却一年的伤心,将快乐装备; 抖落一切的郁闷,将朝气携身; 愿你沐浴在友谊的阳光下,奋勇前进。 一:可以直接通过抓包工具获取接口 接着就可以直接请求,来获取热搜数据了。 二:通过热搜的分享页面获取接口 点击右上角的分享选项,复制链接后,用浏览器打开。
我们点击一个话题,来找一下热搜下对应的话题数据: 右上角的播放量数据在 https://aweme-hl.snssdk.com/aweme/v1/hot/search/list/?&source=3&os_api=23&version_code=860
想要的数据就有了,比如当前话题总参与人数,可以直接GET请求接口来解析数据。 热搜的数据很简单就可以获取到, 但是目前针对于指定话题,一些加密的参数还没有研究明白。欢迎大家留言交流 以一个话题示例: 这里需要 ch_id 才能获取到我们需要的数据。 如何才能简单快捷的获取到这个ch_id呢,经过一段时间的分析。 我发现: 该话题《从地球出发》的ch_id:1635753360881672, 可以在该相关用户的详情中找到。 感兴趣的朋友可以前往查看:抖音用户信息爬取案例 话题下的视频详情: 那么如何获取话题下的视频详情呢,回到模拟器,又发现了右上方的分享选项 https://www.iesdouyin.com/share/challenge/1635753360881672 感兴趣的朋友可以前往查看:抖音视频分享页面_signature 代码部分案例代码,相对比较简介,需要大家自行完善。 热搜榜数据: import requests import pprint # 抖音热搜榜 hot_search = 'https://aweme-hl.snssdk.com/aweme/v1/hot/search/list/?detail_list=1' headers = {"User-Agent":"Mozilla/5.0 (Linux; Android 5.0; SM-G900P Build/LRX21T) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Mobile Safari/537.36"} hot_json = requests.get(hot_search,headers=headers).json() hot_list = [] for data in hot_json['data']['word_list']: item = {} keyword = data['word'] hot_value = data['hot_value'] item[keyword] = hot_value hot_list.append(item) pprint.pprint(hot_list)热搜词对应的阅读人数 这里取其中一个热搜词。 import requests headers = {"User-Agent":"Mozilla/5.0 (Linux; Android 5.0; SM-G900P Build/LRX21T) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Mobile Safari/537.36"} hot_word = '鹿晗吃播' hot_reading = 'https://aweme-hl.snssdk.com/aweme/v1/hot/search/video/list/?hotword={}'.format(hot_word) hot_json = requests.get(hot_reading,headers=headers).json() print("持续时间:",hot_json['aweme_list'][2]['duration']) print("热度值:",hot_json['aweme_list'][2]['hot_info']['value']) print("当前排名:",hot_json['aweme_list'][2]['hot_info']['rank'])单个话题阅读量 import requests dy_topic = 'https://aweme-hl.snssdk.com/aweme/v1/challenge/detail/?query_type=0&ch_id=1635753360881672' headers = {"User-Agent":"Mozilla/5.0 (Linux; Android 5.0; SM-G900P Build/LRX21T) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Mobile Safari/537.36"} topic_json = requests.get(dy_topic,headers=headers).json() view_count = topic_json['ch_info']['view_count'] # 阅读量 print(view_count)如果对大家有帮助或者有疑问,欢迎点赞👍留言! 更新发现 分享页面中话题的 sign 和 个人主页的生成方法一样的。 并且话题视频的get请求中,不需要dytk,带上 ch_id 和 _sign即可。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |