使用八爪鱼采集器抓取网页数据
php抓取网页内容比较常用的是借助第三方类编写抓取代码,其中QueryList是一个基于phpQuery的通用列表采集类,是一个简单、 灵活、强大的采集工具,也比较常用,但是对于一些不用代码想要抓取网页内容的人来说,八爪鱼是一个不错的选择。
操作方法
- 01
首先搜索八爪鱼,进入八爪鱼官网,点击下载八爪鱼安装包;
- 02
安装之后注册账号登录,登录之后进入软件主页,点击任务->新建->自定义采集,输入要采集网页的网址保存即可;
- 03
保存之后软件会自动打开该页面,你可以鼠标依次点击页面中要抓取的内容,也可以在右侧操作提示区域点击取消要抓取的内容;确定无误后点击采集即可;
- 04
保存采集之后选择启用本地采集,之后静静等待就可以看到采集到的数据了;采集出的数据你也可以选择导出;此外,八爪鱼也可以同时采集多个页面,只需要在开始输入网址的时候输入多个网址即可;
赞 (0)