1、用import代码导入相关模块,这里我们导入urllib模块和re模块,具体代码如下:import urllib.requestimport re
2、建立一个变量,名称为url,把想要获取数据的网址赋值给这个url,代码如图所示。这里我们获取到的是疫情的一个数据。
3、接下来我们向这个url发送请求,具体代码为:res = urllib.request.urlopen(url)
4、然后我们获取网页数据,具体代码为:date = res.read().deco蟠校盯昂de("utf8")因为网站是utf8编码格式,所以这里我们加入了编码的参数
5、接下来我们开始写正则表达式的规则部分,具体代艨位雅剖码如下:pattern = re.compile(r'Count":\d{5},"')
6、继续完善正则部分的代码:res = re.findall(pattern,date)经过以上的处理,我们用print 打印结果:print(res[0])
7、整体代码总窑钕仇焱结和运行效果:import urllib.requestimport reurl = "https://ncov.d旌忭檀挢xy.cn/ncovh5/view/pneumonia"res = urllib.request.urlopen(url)date = res.read().decode("utf8")pattern = re.compile(r'Count":\d{5},"')res = re.findall(pattern,date)print(res[0])