1、餐厅数据—以百度地图为例你是某美食平台的市场人员,要为你近期举办的美食活动寻找合作商家但不知道从何联系。你是美团网一名业务人员,为了商家入驻的目标每日奔波在大街小巷却找不到更高效的开发方法。你是餐饮广告业务推广人员,认为开发客户不应该只有登门拜访这么单一。于是,你打开了八爪鱼采集器,贴入了百度地图的网址,输入了“餐厅”二字,点击“搜索”。
2、在八爪鱼规则里,你简单设置了翻页循环,逐一点取你需要的数据例如商家名称、评价指数、地址、电话。一分钟后,你爬取了地图数据,得到了一份餐饮商家名单。
3、当然,这些都建立在你多次的采集操练,曾经,你在地图上爬取的数据是错位的,你百思不得其解,求救了采集老手之后,你明白是Xpath的设置问题。所以今天,你轻车熟路地在“提取数据”这个步骤修改了Xpath。
4、你骄傲地宣称,这一整个采集过程,花了不到两分钟的时间。成都火锅店—以高德地图为例你是一名火锅底料经销商,早年也承接火锅食材的批发生意,或者你梦想着有一天,能开一家自己的火锅店。总之,在成都这个城市,你嗅到了火辣辣的火锅商机。
5、因此,你需要掌握成都所有的火锅店的数据,其中最重要的是他们的选址和电话,不管是用于业务开发还是为了以后的火锅创业而关注筹划。你以为我肯定又要说你打开了八爪鱼采集器,NO!你首先打开了高德地图网页,然后再打开了八爪鱼采集器。复制网址,点击设置你要收集情报的地区“成都”,输入关键词“火锅店”。
6、然后你逐一勾选了自己想要提取的情报,就是下面这些
7、高德地图很矫情,它的采集页面是Ajex页面(假装我知道什么是Ajex页面),反正八爪鱼采集大神多次对我强调,你要记得在“提取数据”之后还要设置“返回”,如下图所示。
8、就这样,成都地区火锅店的采集就大功告成了,好吧,我知道你们只想看采集成果。
9、酒店信蝌怦吩曰息—以搜狗地图为例作为酒店管理专业的学生,你可能正在经历深圳酒店行业分析报告的折磨。作为酒店运营者,你希望能够实时掌握竞争醑穿哩侬对手酒店的定价信息。或者你只是一个普通的酒店业务开发人员,不管什么业务,总之你就是需要相关的酒店数据。于是你打开八爪鱼贴入网址,搜索酒店,创建一个简单的规则,提取你所需的数据,直接生成了一份深圳市酒店的数据。其中包括酒店名称、价格、好评率、电话、地点等等,是不是很详细?
10、地图采集需要掌握一定的xpath知识,如果各位看官有兴趣深究为大神,可以在八爪鱼官网找到这两个视频自学。
11、如果不想动手做规则的,很简单,你也可以移步“数多多”规则市场,里面关于地图采集的规则种类繁多、应有尽有,有些还可以采集到商家具体的坐标。