40行代码+奇技淫巧搞定专属电脑壁纸库【附壁纸】

Python爱好者社区 · 公众号 · Python · 2017-09-11 17:06

正文

要爬取图片网页，特别是这种瀑布流的网页，一个很重要的点就是怎么自动翻页，所以我直接从这一点入手。一般来说，翻页数据是动态加载，所以，你可以选择network部分，只查看XHR，一边把网页往下滑动看看它都动态加载了一些什么，结果如图：

可以看见，其实格式还是挺统一的嘛！随便点一个看看，会发现像这样的一个网址：

可以看到后面部分都是网页参数，而且是带有时间的参数，哎哟，这可怎么搞。秉着对于不知道的先瞎搞再说的原则，我直接把后面的参数去掉，得到这样的链接，翻页就是page往上加：

一回车，情景是这样的：

我一看就懵逼了，这原来是个js文件，看着好乱，怎么办！！等我定睛一看，里面好像有挺多像.jpeg和.png之类的链接地址，地址里面还有图片的id！！像这样：

推荐文章

Python初级入门到精通 · Python-finally语句与应用

3 小时前

Python爱好者社区 · 太炸裂了！亚马逊云来了

昨天

Python爱好者社区 · 90W，确实可以封神了！

2 天前

Python爱好者社区 · 北大“韦神”粉丝超千万，家属回应牙齿缺失

2 天前

Python大全 · 16个必知必会的Python技能！

昨天

大楚网 · 湖北一父子勇斗歹徒儿子牺牲父亲伤残

8 年前

FM93交通之声 · 比“毁容式剪发”更狠的来了！这件事儿99%的浙江人都担心过，结果被她摊上了…

8 年前

晚安少年 · 晚安少年两周年 | 想和你们讲讲我的故事。

8 年前

美食家常菜谱做法 · 8种鸡蛋卷饼的做法，早餐有着落了！看着都想舔屏了！

8 年前

新材料在线 · 《欢乐颂2》结束了，你是想要安迪的同款保时捷，还是曲筱绡的同款赵医生？

7 年前