如何采集单网页

 时间:2024-10-19 01:21:20

1、本文用来演示采集单个网页的基本步骤,是学习采集软件入门的基础.首先打开采集器→点击快速开始→新建任务,进入到任务配置页面:

如何采集单网页

2、选择任务组,自定义任务名称和备注;

如何采集单网页

3、上图配置完毕之后,选择下一步,进入到流程配置页面,往流程设计器中拖入一个打开网页的步骤;

如何采集单网页

4、选中浏览器中的打开网页步骤,在右边的页面URL中输入网页URL并点击保存,系统会在软件下方的浏览器中自动打开对应网页:

如何采集单网页

5、下面进行数据字段的提取,点击浏览器中需要提取的字段,然后在弹出的选择对话框中选择抓取这个元素的文本;

如何采集单网页

6、上述操作之后,系统会在页面的右上方显示我们将要抓取的字段;

如何采集单网页

7、接下来配置页面中其他需要抓取的字段,配置完成之后修改字段名称;

如何采集单网页

8、修改完成之后点击上图中的保存按钮,再点开图中的数据字段可以看到,系统将会显示最终的采集列表;

如何采集单网页

9、点击上图中的下一步→下一步→启动单机采集(调试模式),进入到任务检查页面,以确保任务的正确性;

如何采集单网页

10、点击开始单机采集,系统将会在本地执行采集流程并显示最终采集的结果;查看原文或更多教程,请登录官方。

如何采集单网页
  • 考研分数构成是什么
  • dy/dx是什么意思
  • puts()的功能是什么
  • 怎样打开使用Jupyter Notebook??
  • 热门搜索
    儿童手抄报图片大全 迎中秋庆国庆手抄报 关于文学的手抄报 端午节手抄报简单字少 关于五一劳动节的手抄报 母亲节手抄报大全 我爱读书手抄报图片 环境卫生手抄报 未来的2035年手抄报 英语手抄报的内容