1、下载安装火车头采集器,有甾鞘粝霆付费与免费版,百度查找下载地址。http://www.locoy.com/Down/ 从这里下载
2、下载好后,双击火车头图标打开采集器。
3、进入火车头主程序页面。
4、单击新建的黑小三角,新建任务。
5、填写任务名,点击第二步。(采集网址不截了,以防广告)
6、第一步采集网址规则
7、浏览器都有源代码,可以查看代码 找到目标内容,分析目标内容前后的代码。此时标题的前后代码为“<h1>”、“</h1>”。
8、第二步采集内容规则 双击采集器“标题”。
9、选择前后截取,把前后代码分别填进去,如图。
10、或者,选择正则提取,如图,点击确认。
11、截内容用法与截标题的相同,就是目标不同,同样找唯一特点的。
12、第二发布内容设置
13、启用 方法1 WEB在线发布到网站,做完这一步其实可以把采集的数据写到后台数据库里了,点保存,开奘疚豫枭始采集,如果本地要保存文档或文件,下面继续操作
14、启用方法2选择自己要保存的地方,格试,最后保存,这个是保存本地文档。提供查看