1、登录织梦网站的后台,在左侧菜单栏找到 “ 采集”,点击采集站点管理
2、点击增加新节点
3、选择内容模型有“普通文章”,“图片集”两种类型,根据自己采集文章的类型,进行一个选择
4、填写采集节点的信息1.节点的名称,自己定义一个名2.页面的编码 ,会在下面进行一个介绍3.匹配方式,一般是栓疠瑕愤字符串,善用正则表达式的,可选择正则表达式4.引用网址:填写你要采集内容的网址5.匹配方式:有规律的可以根据规律来进行批量生成,没有规律的就叔公制定网址
5、我们以济南SEO这个博客为例哈,首先看一下页面的编码打开网页右击选择 查看源文件 ,编码是uft-8的,那我们再选则页面编码的时候,就选utf-8的那个
6、匹配方式:如果采集的网址有规律,有图所示http://www.yunyunseo.com/wzyh/page/2http://www.yunyunseo.com/wzyh/page/3路径你可以写成http://www.yunyunseo.com/wzyh/page/(*)
7、填写文章网址路径的原则,如下图所示,方法如步骤5,找到页面,点击右键查看源文件,然后找到文章列表中唯一的一个html代码
8、填写完成之后,点击保存信息并进入下一步设置,如下图所示,之后,再点击保存信息并进入下一步设置
9、设置内容获取规则,然后保存,进行采集内容