1、创建项目
2、安装requests模块
3、模块安装成功
4、创建py文件
5、编写爬虫代码
6、编辑界面右键菜单中选择Run 'Spider'
7、运行结束,输出“baidu.html is got!!”,文件夹中得到一个新文件“baidu.html”
8、使用浏览器打开本地文件“baidu.html”
9、打开文件后发现页面中存在乱码
10、修改代码,修改请求到的响应的编码格式
11、再次运行代码,打开重新得到的“baidu.html”,乱码消失,爬取到的页面正常
时间:2024-10-12 14:43:23
1、创建项目
2、安装requests模块
3、模块安装成功
4、创建py文件
5、编写爬虫代码
6、编辑界面右键菜单中选择Run 'Spider'
7、运行结束,输出“baidu.html is got!!”,文件夹中得到一个新文件“baidu.html”
8、使用浏览器打开本地文件“baidu.html”
9、打开文件后发现页面中存在乱码
10、修改代码,修改请求到的响应的编码格式
11、再次运行代码,打开重新得到的“baidu.html”,乱码消失,爬取到的页面正常