1、从网页复制内容到WORD,并认真观察干扰码的规律。以图示为例,我们发现,需要的正文为纯汉字。干扰码为数字、英语和符号。
2、对曳骣苷镐照ACSII码表,数字段十进制代码为48-57,大写英文十进制代码为65-90,其他为各类符号。由于我们需要保留的为纯汉字,所以可以将ACSII码表32-126码段全部替换为空。
3、在W蚪嬷吃败ORD中按“CTRL+H”调出替换窗口,在查找内容栏输入[^32-^126],然后在搜索选项勾选“使用通配符”,然后点击“全部替换”就可以得到干净清爽的正文了。
时间:2024-10-18 12:21:02
1、从网页复制内容到WORD,并认真观察干扰码的规律。以图示为例,我们发现,需要的正文为纯汉字。干扰码为数字、英语和符号。
2、对曳骣苷镐照ACSII码表,数字段十进制代码为48-57,大写英文十进制代码为65-90,其他为各类符号。由于我们需要保留的为纯汉字,所以可以将ACSII码表32-126码段全部替换为空。
3、在W蚪嬷吃败ORD中按“CTRL+H”调出替换窗口,在查找内容栏输入[^32-^126],然后在搜索选项勾选“使用通配符”,然后点击“全部替换”就可以得到干净清爽的正文了。