1、这是一个通用版本的火车头采集发布页面,页面大致分为四个部分:web发布到网站,保存到本地文件,保存到数据库,其他扩展。保存到数据库以及其他扩展涉及的知识面过多,鉴于篇幅这里就不一一详解,日后在维特博客的其他文章中再做介绍。
2、通过web发布数据到网站勾选发布到web站点时,我们发现无法添加发布配置,这是由于我们还未进行相关的配置,首先我们需要点击web发布配置管理来进行相关的数据配置。在web发布配置管理中,软件帮我们内置了一些常见的开源CMS模块,如果恰巧版本相同而且没有任何BUG,直接选中是最简单的方式,如果是小众CMS抑或其他后台,则需要自定义相关的配置,这里我们可以点击1在线选择发布模块中的新建来配置一个适合自己的模块。
3、网站自动登录方面我们可以直接填写后台地址的一部分,譬如后台地址是:网站根网址/admin.php这里我们可以填写/admin.php,简单的说可以填写出去根网址的后缀,如果关闭验证码登录则可以忽略验证码填写,后面的内容就不必再填,待会利用cookie直接登录会更简单,从顶部的选项卡上跳转到内容发布参数。在发布页面中填写发布地址后缀与后台地址后缀同理,不作详细介绍,这里主要讲如何填写接口。监听接口的传输可以用chrome或者ff自带的控制栏,这可能不太友好,这里我推荐一款软件fiddler,利用fiddler可以轻松简单的弄清表单传输的方式。
4、这是一个fiddler安装完成的页面,首先点击左下角直到只监听web,同时注意关闭一些浏览器代理工具,然后我们只需要打开网站后台发布文章页面,发布一篇文章,fiddler就能自动的帮我们记录所有的请求。
5、点击发布文章后我们能看到fiddler的左边已经记录请求,双击它则可以在右边的inspectors中的webforms中看到详细的属性与值。很显然post_title属性的意思就是标题,我的文章标题是“新的标题”,所以其对应值无疑也是“新的标题”,以此类推,将这些属性与值填写进火车头的内容发布参数中,最后别忘了点保存!
6、回到web发布配置管理中,全局变量如果没有需求/不了解可以不选,编码这些不再细说,填入网站根网址,然后再内置浏览器中登录就可以自动记录cookie值,省去了不少麻烦。最后当然是保存,回到发布内容设置中点击添加发布配置,添加刚才的配置模块就已经大功告成。
7、保存到本地这种方式相比来说比较简单,但后期还是需要手动发布到网站,如果数据较大也是不小的困扰,点击查看默认模板就能找到系统晷月水净帮我们预设的几个简单模板,其实就是[属性]的方式,如果自己在采集时添加了其他属性,也可以自行添加。这里唯一需要注意的一点是编码的选择一定要正确,同时模板也有编码,如果文件编码已经选择正确仍旧乱码,则把默认模板的编码改动一下即可。虽然步骤有些繁琐,但设置好之后面对频繁的采集和发布也省心不少。对于采集方面的其他经验知识我会在维特博客wittsay.cc以后的更新中提到,有兴趣的朋友可以收藏一下博客,一起分享经验。最后不得不重新再提一次,采集并不是一条成功的捷径,好的网站与原创是密不可分的,采集技巧也是给大家一个参考启发的方式。