1、引入模块“urllib2”。
2、设置要采集的地址:url=‘http://www.baidu.com/’。
3、使用“urlopen”方法返回网页文件:a=urllib.request.urlopen(url)。
4、只能使用“read”方法获取网页文件的内容:f=a.read()。
5、看一下“f”的长度就知道是否真的返回了网页:len(f)。
时间:2024-10-13 18:26:37
1、引入模块“urllib2”。
2、设置要采集的地址:url=‘http://www.baidu.com/’。
3、使用“urlopen”方法返回网页文件:a=urllib.request.urlopen(url)。
4、只能使用“read”方法获取网页文件的内容:f=a.read()。
5、看一下“f”的长度就知道是否真的返回了网页:len(f)。