关关采集器采集规则编写教程

 时间:2024-10-29 08:17:01

1、在关关采集器Rules文件夹下建立一个xml文件。为了方便区分,今天给大家演示编写云谣阁的采集规则,我就把这个xml文件命名为yunyaoge.xml

关关采集器采集规则编写教程

2、点击规则--规则管理器 出现如图所示。点载入开始编写采集规则

关关采集器采集规则编写教程

3、下面说下需要填写的内容左边这里点击之后在右边都会出现相关的说明。很简单的。只需要记住几个关键就行了 下面给大家举例说明一下记住一下几个正则.+? ((.|\n)+?)\d*

关关采集器采集规则编写教程

4、今天给大家演示采集的网嗄磅麇蚺站是www.yunyaoge.com,我们就打开这个网站首页,然后在网页随意空白处点击右键,然后点查看源文件(或者是查看网页源代码浏览器不同,显示的不同,但是意思是一样的),这里我看可以看到<meta charset="gbk" /> 表示这个网页是gbk编码的。这里在这里让填写编码我们就写gbk就行了

关关采集器采集规则编写教程

5、同样的道理,下面的nove盟敢势袂lname novelauthor这些我们都直接正则匹配就行了。就拿novelname来说 我们恐糍咦鞅打开网页http://www.yunyaoge.com/xs/0/88/点击查看源文件,找到作者<meta property="og:novel:book_name" content="圣墟" />那么我们这里直接写<meta property="og:novel:book_name" content="(.+?)" />如图所示

关关采集器采集规则编写教程

6、一步一步的写完,那么接下来就是测试结果了。如果哪里有不对的地方,测试的时候会有提示。按照提示再修改就行了

关关采集器采集规则编写教程
  • 怎么查看vivo应用商店的版本
  • 爱回收客服在哪
  • 福州聚春园有什么好吃的?
  • 北汽新能源EC车辆雨刮怎么调节
  • 行车必备应急工具有哪些?
  • 热门搜索
    手抄报 反邪教手抄报 防溺水手抄报内容 英文手抄报 中国传统节日手抄报 健康手抄报 英语手抄报图片 心理健康手抄报内容 关于防溺水的手抄报 防疫情手抄报