如何使用网文采集大师采集指定博客名下所有文章

 时间:2024-10-13 02:25:19

1、第一步,我们得先在软件中输入该博主的博文目录页网址,打开网页。

如何使用网文采集大师采集指定博客名下所有文章

2、第二步:提取博主的文章目录链接我们可以先复制不同位置的三个链接,这个博主文章发的多,光目录都有62页,我们尽量在不同页中复制唁昼囫缍这种链接,放在一起检查一下这几个链接,从中我们不难发现,他的所有文章的链接,前面一部分都是相同的,好,我们就以链接中的这段字符作为关键字,在软件网址输入框右侧的过滤关键字中输入这段共有的字符串,这里的“*”是通配符,可以代表1到多个任意字符,后面的.html是博文链接的扩展名,您不输入也可以,但是我们取关键字,就一定要取如数学中的多个数的最大公约数。设置了过滤关键字,接下来再设置下一页链接关键字,看一下,链接页面的下一页链接文字显示的就是“下一页”,我们直接在此输入框输入“下一页”即可,输入完,再点击“执行命令”,在弹出菜单中点击“提取目录链接”即可,程序就会开始自动连续不断去提取文章链接了,直到62页链接全部提取完毕。

如何使用网文采集大师采集指定博客名下所有文章

3、第三步:接下来,我们就要开始正式采集这些链接对应的正文了。点击刚才我们所提取到软件左侧链接谱驸扌溺列表中的一个链接,链接地址会自动显示在软件网址输入栏,再用鼠标点击网址输入栏后回车,查芬简砝鬃看博文的正文的开始及结束位置,经过比较,我们可以用网页上的“转载▼”作为正文起始位置关键字,用“分享:”作结束位置关键字,再依次打开链接列表中两到三个,同样进行如上操作,点击“获取文章”进行测试,发现都可正常获取。注意这种分割关键字的选取,也是要尽量照顾所有链接对应的文章,对于同一个列表中的页面要有通用性,也就是每页都要有的,如果有的页面没有,那么在提取时,就有可能提取不到文字,就像拉网捕鱼一样,网开始要撒得大,然后再慢慢收缩,如果一开始就撒得太小了,就可能捕不到鱼了。另外对于有的文章,我们还可选取“段落重排”、“去除干扰码”、“特殊删除”等选项,减少后期排版编辑的工作量。

如何使用网文采集大师采集指定博客名下所有文章

4、第四步:确定文章保存的文件名的命名方式我们看每个博文在软件标题栏显示的标题,可以看到每个标题后面都跟了“_朱力方_新浪博客”,所以我们在保存文章按钮前一个输入框中输入“_",保存文章前第二个输入框不用输入文字,输入完后可以点击保存文章试一下,看到软件左下角的文件浏览区已经有一篇文章了,注意,软件采集的文章都在左侧设置的对应的目录中,文件夹和文件列表框右键都有快捷菜单的。最后,我们再点击执行命令按钮,在弹出菜单中选择”批量单页采集“就可一边喝茶去了。

  • TL-WDR5620千兆版怎么修改无线密码
  • 抖音极速版和刷宝短视频哪个赚钱快?
  • 牙齿松动是怎么回事
  • 贵州健康码怎么变成金色
  • 宠物兔喂养的正确方法
  • 热门搜索
    长城手抄报图片大全 预防流感手抄报 文学手抄报的内容 关于爱国的手抄报内容 语文手抄报五年级 校园礼仪手抄报 治污减霾手抄报 趣味数学手抄报 综合实践手抄报 六年级手抄报图片