Python爬取B站，咸鱼的正确 GET 姿势

python · 公众号 · Python · 2017-09-22 21:12

正文

请到「今天看啥」查看全文

requests
import re
class BiliBiliSpider (object) : def __init__ (self) : self._images = [] self._oldImages = [] # 保存已经获取过的图片地址

def _getImages (self, url) : content = requests.get(url).text dic = json.loads(re.match( r'^([a-zA-Z0-9_(]+)(.*)(\))$' , content).group( 2 )) data = dic[ 'data' ]

# 判断是动态区和还是评论区的数据 if 'archives' in data: final = data[ 'archives' ]
else : final = data

for i in range(len(final)): image = final[i][ 'pic' ]
if image not in self._oldImages: # 去重 self._images.append(image) self._oldImages.append(image)
def getResult (self, url) : self._getImages(url) temp = self._images self._images = []
return temp

OK，接下来写下载器：

获取需要下载的图片地址
进行下载
我这里是用数字作为图片的名字保存起来的，数字用一个 count.txt 文件保存，为了好看一点吧...

        #coding:utf-8

        __author__ = 'Lanc4r'

请到「今天看啥」查看全文

推荐文章

陈安之 · 我喜欢和你在一起，因为你有正能量

8 年前

唐唐频道 · 看完这两个马桶的超现实用法，我感觉自己这些年的厕所都白上了！

8 年前

十点电影 · 非人类 | 当漂亮妹子主动向你撒娇，你就要小心了……

8 年前

FM93交通之声 · 生意失败炒股亏本，丈夫便利用妻子的艳照“赚钱”，更奇葩的是…

8 年前

唐唐频道 · 7种虐死单身狗的姿势，我受到了1万点伤害！

8 年前