专栏名称: Python爱好者社区
人生苦短,我用Python。分享Python相关的技术文章、工具资源、精选课程、视频教程、热点资讯、学习资料等。每天自动更新和推送。
目录
相关文章推荐
Python初级入门到精通  ·  Python-finally语句与应用 ·  3 小时前  
Python爱好者社区  ·  太炸裂了!亚马逊云来了 ·  昨天  
Python爱好者社区  ·  90W,确实可以封神了! ·  2 天前  
Python爱好者社区  ·  北大“韦神”粉丝超千万,家属回应牙齿缺失 ·  2 天前  
Python大全  ·  16个必知必会的Python技能! ·  昨天  
51好读  ›  专栏  ›  Python爱好者社区

40行代码+奇技淫巧搞定专属电脑壁纸库【附壁纸】

Python爱好者社区  · 公众号  · Python  · 2017-09-11 17:06

正文

请到「今天看啥」查看全文


要爬取图片网页,特别是这种瀑布流的网页,一个很重要的点就是怎么自动翻页,所以我直接从这一点入手。一般来说,翻页数据是动态加载,所以,你可以选择network部分,只查看XHR,一边把网页往下滑动看看它都动态加载了一些什么,结果如图:

可以看见,其实格式还是挺统一的嘛!随便点一个看看,会发现像这样的一个网址:

可以看到后面部分都是网页参数,而且是带有时间的参数,哎哟,这可怎么搞。秉着对于不知道的先瞎搞再说的原则,我直接把后面的参数去掉,得到这样的链接,翻页就是page往上加:

一回车,情景是这样的:

我一看就懵逼了,这原来是个js文件,看着好乱,怎么办!!等我定睛一看,里面好像有挺多像.jpeg和.png之类的链接地址,地址里面还有图片的id!!像这样:







请到「今天看啥」查看全文