1、第一,先安装python-docx模块。打开cmd命令窗口,输入pip install python-docx,就可通过管道安装python-docx模块。
2、第二,进入cmd命令窗口,输入python,进入python交互环境
3、第三,引入python-docx模块,此处要注意,虽然安装模块是python-docx模块,但要使用:“ import d泠贾高框ocx ”引入此模块。引入os模块,通过os.getcwd()获取当前工作目录,并将一份001.docx文档放在该工作目录下。
4、第四,使用docx.document()函数打开word文档,并使用len()函数得出此文档的段落数量。
5、第五,使用doc.paragraphs[i].text方法获取第一段和第二段的文字。
6、第六,获取word文档的全部内容,这里使用了一个循环语句:for i in range(3补朱锚卦37): d泠贾高框oc.paragraphs[i].text其中,337是通过len(doc.paragraphs)得到。