赶集网电话号码采集
介绍采集赶集网电话号码的方法
选择要采集的分类
- 01
打开赶集网首页选择你要采集的分类
- 02
选择好你要采集的分类,鼠标将页面拉至底部,点击选择该页面的极速版,如图中所示
打开采集器,建立采集任务
- 01
打开采集器,选择高级模式,点击开始采集(没有账号的用户注册一个就行了,很方便的)
- 02
输入任务名称点击下一步,如图片所示(需要备注的可以自己家,也可以创建分组,我这边就简单演示一下)
建立采集规则
- 01
复制要采集页面的URL,将红色方框内的打开网页拉至流程线,将复制的URL粘贴好,点击保存,如图片所示
- 02
打开网址后如图点击高级选项
- 03
点击缓存设置,勾选清理缓存和自定义Cookie,点击获取当前页面Cookie,图标点亮,点击保存,如图片所示
- 04
接下来将要采集的页面拉至底部,找到下一页,鼠标右键点击,选择执行循环下一页操作,如图片所示
- 05
完成上面的操作,页面如图片,点击自定义
- 06
点击方框的元素文本,点击确认,如图片所示
- 07
鼠标右键点击采集页面的第一个商家,如图所示,在选择执行红色方框的操作
- 08
将公司名称添加到列表,选择继续编辑列表
- 09
选择本页最后一个商家,点击鼠标右键,选择添加到列表
- 10
页面中所有的商家将会被全部采集到列表中,点击红色方框,完成商家列表的创建
- 11
点击循环,完成列表循环
- 12
完成商家列表后,把流程图里提取数据的循环拉倒翻页循环里
- 13
完成后就如图片所示
- 14
单击点击元素进入商家的详细界面抓取数据
- 15
找到打开页面中的电话联系方块,鼠标右键打开,执行红色额方框的操作
- 16
抓取后修改字段名称
- 17
完成规则编辑,点击进入下一步
- 18
点击进入下一步
开始采集,导出数据
- 01
点击启动单机采集
- 02
开始采集,进入采集页面
- 03
导出数据,完成采集
赞 (0)