Python爬虫中的中文网址转译

 时间:2024-10-22 03:20:49

、Python不支持中文, 它是解释性语言;解析器只支持 ascii 0 - 127爬取带有中文的网址, 会报错UnicodeEncodeError: 'ascii' codec can't encode characters in position 10-11: ordinal not in range(128)

工具/原料

python3.x

报错信息

1、执行代码

Python爬虫中的中文网址转译

2、报错信息

Python爬虫中的中文网址转译

3、网址里面包含了汉字ascii是没有汉字的需要进行url转译将包含汉字的网址进行转译

urllib.parse, string

1、在python3中, 用到2个转译模块: urllib.parse, string珑廛躬儆导入新的模块, 然后对网址进行转译, 这样才能正确识别

Python爬虫中的中文网址转译

2、运行以后, 查看输出结果"嫩滑" 这个中文被进行了转译

Python爬虫中的中文网址转译
  • 儿童护理题目
  • 冷泡茶,让夏天更健康
  • OBT(欧比特)怎样赚钱收益
  • 情人节怎么过?
  • 长白山到雪乡怎么坐车
  • 热门搜索
    我爱文学初中手抄报 绿色出行齐步走手抄报 四年级数学手抄报内容 小记者手抄报 我国的世界遗产手抄报 地震手抄报内容 备战期中手抄报内容 有关中国梦的手抄报 手抄报花边图案大全 千字文手抄报