正文
那现在就是要找到我们需要爬虫的网站链接啦!我分析了一下,大概是下面三种:
#歌曲清单
music_list = 'https://music.163.com/#/playlist?id=2412826586'
#歌手排行榜
artist_list = 'https://music.163.com/#/artist?id=8325'
#搜索列表
search_list = 'https://music.163.com/#/search/m/?order=hot&cat=全部&limit=435&offset=435&s=梁静茹'
如果你已经只是想下载一首歌,比如静茹-勇气: https://music.163.com/#/song?id=254485 ,那你直接就用浏览器打开 http://music.163.com/song/media/outer/url?id=254485 就可以了,没必要爬虫啊!
好啦!感觉重点都说完了,提取和解析就是用 lxml,不懂的就看我之前的文章啊 《Python爬虫实践入门篇》
3、下载歌词
如果还要下载歌词,那也很简单,通过接口,有歌曲的id就可以:
url = 'http://music.163.com/api/song/lyric?id={}&lv=-1&kv=-1&tv=-1'.format(song_id)
返回的json数据大概长这样:
{
sgc: true,
sfy: false,
qfy: false,
lrc:
{
version: 7,
lyric: "[00:39.070]开了窗 等待天亮
[00:46.160]看这城市 悄悄的 熄了光
[00:51.850]听风的方向
[00:55.090]这一刻 是否和我一样
[00:58.730]孤单的飞翔
[01:02.300]模糊了眼眶
[01:07.760]广播里 那首歌曲
[01:14.830]重复当时 那条街那个你
[01:20.410]相同的桌椅
[01:23.740]不用言语 就会有默契
[01:27.470]这份亲密
[01:30.560]那么熟悉
[01:33.850]在爱里 等着你
[01:37.480]被你疼惜 有种暖意
[01:41.090]在梦里 全是你
[01:43.920]不要再迟疑 把我抱紧"
},
klyric:
{
version: 0,
lyric: null
},
tlyric:
{
version: 0,
lyric: null
},
code: 200
}
剩下的也没有什么好说的啦!