1、首先有三种方法,一是用微软提供的扩展库win32com来操作IE,二是用selenium的webdriver,三是用python自带的HTMLParser解析。
2、一是用微软提供的扩展库win32com来操作IE,win32com可以获得类似js里面的document对象,但貌似是只读的(文档都没找到)。
3、二是用selenium的webdriver,selenium则提供了Chrome,IE,F坡纠课柩ireFox等的支持,每种徽涕濠铿浏览器都有execute_script和find_element_by_xx方法,可以方便的执行js脚本(包括修改元素)和读取html里面的元素。
4、不足是selenium只提供对python2.6和2.7的支持。
5、三是用python自询骆帘呦带的HTMLParser解析,HTMLParser则是需要自己写个类继承基类,重写解析元素的方法。个人感觉selenium用起来更方便,很容易操作html里的元素。