Python爬虫：逆向分析酷我音乐请求参数（支持SQ超品音质）

您所在的位置：网站首页 › 酷我音乐的无损是真的吗 › Python爬虫：逆向分析酷我音乐请求参数（支持SQ超品音质）

Python爬虫：逆向分析酷我音乐请求参数（支持SQ超品音质）

2023-12-30 23:17| 来源: 网络整理| 查看: 265

文章目录前言1. 请求分析2. 获取参数3. 完整代码结束语

前言

在这里插入图片描述在我的爬虫专栏中已经对网易云音乐和酷狗音乐做了请求参数分析，那本篇博文就分析一下酷我音乐的请求参数，还是老样子，详细代码已上传至我的GitHub。目标：通过输入歌名或者歌手名，列出相应的音乐信息，然后通过选择某一项，将对应的音乐下载到本地指定目录。工具：Google Chrome、PyCharm 这里就不以我最喜欢的歌手本兮为例，这次咱们搜索目前较火的歌曲----下辈子不一定还能遇见你。

在这里插入图片描述

1. 请求分析

按照惯例，我们先看一下音乐的URL参数，具体操作就不多说了，可以看我的专栏里其他音乐爬虫文章。

在这里插入图片描述

很轻易地就找到了，音乐链接包含在一个响应体内，JSON格式，通过这个链接就可以下载到相应的音乐。下面来看一下该响应对应的请求：

在这里插入图片描述

可以清楚地看到，请求方式为GET，下面通过PostMan来查看一下具体参数是什么意思：

在这里插入图片描述

经分析，必须参数有两个：rid表示歌曲的id，br表示比特率，说通俗点就是音质。那么，重点来了！！！

在这里插入图片描述根据经验，这个参数应该是可以改的，毕竟学过语音信号处理。于是乎，尝试了一下：192k，320k。卧槽，果然，下载到了稍大的音乐文件：

在这里插入图片描述经过和手机端对比，192k表示高品音质，320k表示超品音质。

在这里插入图片描述

2. 获取参数

音乐URL参数已经知道是什么意思了，下面来找一下这个参数rid在哪，来到搜索页面：

在这里插入图片描述搜索页面还是很nice的，检索结果好多页，不像网易云和酷狗那么扣。下面依旧是行云流水般地查找请求：

在这里插入图片描述往下翻，就找到了。

在这里插入图片描述

像这种搜索结果，直接就出找带search或者key字样的链接，小技巧哦！！！

在这里插入图片描述依旧是GET请求，放到PostMan看一下参数：

在这里插入图片描述直接就403 Forbidden了，很明显，有反爬虫机制，再去浏览器看一下Request Headers信息：

在这里插入图片描述下面在PostMan中加入参数，经测试，请求头需要带上Cookie、csrf、Host、Referer、User-Agent，常规操作。经分析，搜索URL必须的参数key，表示输入的搜索关键字。

在这里插入图片描述

3. 完整代码

经过上述分析，都OK了，不过在实际的爬取过程中，由于搜索列表那个URL请求时需要重定向，其他的请求URL不需要，所以需要对请求头做一些略微的修改，具体修改方法可参阅代码。

# -*- coding: utf-8 -*- # @Time : 2021/5/16 22:41 # @Author : XiaYouRan # @Email : [email protected] # @File : music.py # @Software: PyCharm import time from hashlib import md5 import json import requests import re import os from urllib import parse def precess_time(func): def wrapper(*args): minutes, seconds = divmod(int(args[0]), 60) result = str(minutes).zfill(2) + ':' + str(seconds).zfill(2) return result return wrapper @precess_time def get_songtime(time_str): return time_str class KuWoMusic(object): def __init__(self): self.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ' 'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36', 'Cookie': '_ga=GA1.2.136730414.1610802835; _gid=GA1.2.80092114.1621072767; Hm_lvt_cdb524f' '42f0ce19b169a8071123a4797=1621072767; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797' '=1621073279; _gat=1; kw_token=C713RK6IJ8J', 'csrf': 'C713RK6IJ8J', 'Host': 'www.kuwo.cn', 'Referer': ''} def get_html(self, url, search_key=None): if 'rid' not in url: self.headers['Referer'] = 'http://www.kuwo.cn/search/list?key=' + search_key else: del self.headers['Referer'] del self.headers['csrf'] try: response = requests.get(url, headers=self.headers, verify=False) response.raise_for_status() response.encoding = 'utf-8' return response.text except Exception as err: print(err) return '请求异常' def parse_text(self, text): print('{:*^80}'.format('搜索结果如下')) print('{0:{5}

【本文地址】

Python爬虫：逆向分析酷我音乐请求参数（支持SQ超品音质）

Python爬虫：逆向分析酷我音乐请求参数（支持SQ超品音质）

今日新闻

推荐新闻