目前抓站越来越难,特别是现在很多内容是通过js加载或者是乱起八糟的东西拼凑出来,酷炫是酷炫,但是用后端程序越来越难以抓取。经常有人搜索”如何等js执行完再抓取内容等等”(其实我也搜过)。下边我们来看看如何“以js之道还至js之身”。让你的js跑到任何一个你看到的网页,抓取任何你想要的内容。

直觉上打开网页的正确姿势是浏览器,没错,这次我们就是在浏览器上做文章,毕竟用其他方式打开网页都没有浏览器那么流行。也许你听说过浏览器插件这么个东西,如果你没听说过也没啥问题,毕竟下边要说的就是这个东西。下边我们先从开发一款chrome插件说起。

阅读原文 »

5 1 收藏


直接登录

推荐关注