1、步骤一:新建采集任务1、复制网页
2、新建智能模式采集任务
3、步骤二:配置采集规则1、设置提取数据字段输入网址后软件即可自动识别出页面上的数据并生成采集结果,我们可以右击字段进行相关设置,包括修改字段名称、增减字段、处理数据等。
4、在列表页上,我们需要采集标题、标题链接、上牌时间、里程及价格等信息,字段设置效果如下:
5、使用深入采集功能提取详情页数据由于我们需要采集更详细的信息,因此需要使用“深入采集”功能,跳转到详情页进行采集。
6、在详情页面我们可以看到看车地址及咨询电话,我们添加这两个字段,字段设置效果如下:
7、步骤三:设置并启动采集任务1、设置采集任务点击开始采集之后跳出任务栏,任务栏界面上有“更多设置”的按钮,点击进行设置,从而提高采集的稳定性和成功率。
8、点击“更多设置”按钮,在弹出的运行设置页面中我们可以进行运行设置和防屏蔽设置,系统默认设置“2”秒请求等待时间,勾选“不加载网页图片”,防屏蔽设置就按照系统默认设置,然后点击保存。
9、启动采集任务点击“启动”运行爬虫工具。
10、运行任务提取数据
11、步骤四:导出并查看数据数据采集完成后,我们可以查看和导出数据,我们选择自己需要方式和文件类型,点击“确认导出”。
12、步骤五:采集结果