如何使用火车头快速批量采集文章

 时间:2024-10-16 04:04:49

1、下载火车头软件,输入帐号,密码点击登录。点击“新建任务”。弹出“新建任务规则”对话框。如下图所示:

如何使用火车头快速批量采集文章
如何使用火车头快速批量采集文章
如何使用火车头快速批量采集文章

2、以采集医疗文章为例,找有页数的网站采集。右键复制地址链接。如下图所示:

如何使用火车头快速批量采集文章

3、把提取的链接放到火车头“新建任务规则”里面。批量网址,我页数设置成地址参数。并点击测试如下图所示:

如何使用火车头快速批量采集文章
如何使用火车头快速批量采集文章
如何使用火车头快速批量采集文章
如何使用火车头快速批量采集文章
如何使用火车头快速批量采集文章

4、设置区域“开头字符串”“结尾字符串”。查看源文件,找到div标签单个。如下图所示:

如何使用火车头快速批量采集文章
如何使用火车头快速批量采集文章
如何使用火车头快速批量采集文章

5、接下来,“内容采集规则”点击一篇文章进去,要同样的方法找到文章的“标题”“内容”的“开头字符串”“结尾字符串”

如何使用火车头快速批量采集文章
如何使用火车头快速批量采集文章
如何使用火车头快速批量采集文章

6、”数据处理“可以“替换”文字”HTML标签过滤“等等。还可以拿条连接测试结果。如下图所示:

如何使用火车头快速批量采集文章
如何使用火车头快速批量采集文章

7、第三步“内容发布规则”-”保存为本地文件“-”本地文件启用“-”保存格式“-”txt“等等。运行文章就可以采集了。如下图所示:

如何使用火车头快速批量采集文章
如何使用火车头快速批量采集文章
如何使用火车头快速批量采集文章
  • Beyond Compare3怎么进行文件夹里文件比较
  • 易语言如何实现编辑框和窗口大小随时一致
  • 按键精灵大漠插件免费版完美注册
  • 易语言如果找到指定文本后面的文本,并删除
  • 易语言怎么获取文本内容?
  • 热门搜索
    安全教育手抄报 关于安全的手抄报 关于读书的手抄报 植树节手抄报图片 汤姆索亚历险记手抄报 关于读书的手抄报内容 我读书我快乐手抄报 端午节手抄报图片 保护地球手抄报 讲文明树新风手抄报