1、步骤1:创建采集任务1)进入主界面,选择“自定义采集”
2、2)将要采集的网站URL复制粘贴到输入框中,点击“保存网址”。这里我们先到网易云音乐上面复制想要采集的评论数据网址。然后复制粘贴
3、步骤2:创建翻页循环1)网页打开以后,将页面下拉到底部,点击“下一页”按钮。在右侧的操作提示框中,选择“循环点击下一页”
4、步骤3:创建列表循环及信息提取1)移动鼠标,选中第一条评论,评论框会变成绿色,其中的字段会变为红色底色。然后选择右侧操作提示框中的“选中子元素”
5、2)接着在右边的提示框中选择“选中全部”
6、3)然后选择“采集数据”
7、4)打开右上角的流程按钮,可以删除不需要的字段并编辑字段名称
8、5)因为网页谭终沫冀涉及到Ajax技术,所以需要设置Ajax,如下图,鼠标点击“点击翻页”步骤,打开高级选项,在Ajax加载项勾选Ajax加载数据,设置超时2秒
9、步骤4:采集并导出数据1)点击左上角的“开始采集”,选择“启动本地采集”
10、2)采集完成后,会跳出提示,选择“导出数据”选择“合适的导出方式”,将采集好的数据导出,这里我们选择excel作为导出为格式,数据导出后如下图