1、首先介绍一下抓金泫险缋取流程步骤# step1:抓取单页内容# 利用request请求目标站点,得到单个网页HTML代码,返回结果# step2:正则表达式分析# 根据HTML代码分析得到电影的名称、主演、上映时间、评分、图片链接等# step3:开启循环及多线程# 对多页内容遍历,开启多线程提高抓取速度# step4:保存至文件# 通过文件的形式将结果保存,每一部电影一个结果一行JSON字符串
2、抓取单页内容,利用request请求目标站点,得到单个网页HTML代码,返回结果
3、正则表达式分析,根据HTML代码分析得到电影的名称、主演、上映时间、评分、图片链接等
4、开启循环及多线,对多页内容遍历,开启多线程提高抓取速度
5、保存至文,通过文件的形式将结果保存,每一部电影一个结果一行JSON字符串
6、最后利用python抓取猫眼电影Top100的电影结果。