1、首先看BeautifulSoup的Tag对象:Tag 对象与XML或HTML原生文档中的tag相同,该对象定义了多种函数和属性.如下图所示:
2、比较重要的属性name和attributes的使用方法:每个对象都有自己的名字通过用逗号操作符引用name属性即可.如下图所示:
3、如果对name属性进行修改,直接赋值字符串即可,如下图所示:
4、attributes属性: tag <b class="test"> This is the test b髫潋啜缅egin..."> 有一个 “class"的属性,值为"test" . tag的属性的操作方法与字典相同:如下图所示:
5、attributes的属性操作方法与字典一样,可以被被添加,删除或修改.如下图所示:
6、在BeautifulSoup中多值属性的用例,注意多值属性返回一个列表.但如果是用xml解析的话,不会有多值属性,只返回一个字符串.如下图所示:
7、NavigableString属性:BeautifulSoup用 NavigableString 类来包装tag中的字符串,字符串是用unicode进行编码的,可以通过strin爿讥旌护g的函数replace_with进行字符串的替换.如下图所示:
8、BeautifulSoup属性该属性表示文档所有的内容,一般可当作Tag对象用,包含了一个值为 “[document]” 的特殊属性 .name.
9、Comment属性:该属性是一个特殊类型的 NavigableString 对象,当出现在HTML文档中时, Comment 对象会使用特殊的格式输出,如下图所示: