1、第一步,先读入指定文件的内容。由于这个文件比较小,可以直接读入。如果文件较大,可以逐行或分部分读入内存。
2、第二步,对读入的文本将标点等特殊符号、换行符、空格等替换为空。这一步比较重要,称为数据清洗,一般使用遍历+string.replace(old,new)来完成。
3、第三步,将全文统一转换成小写字母。这是为了便于统计,如果工作要求大小写字母分开统计,这一步可以不操作。
4、第四步,建立统计字典,对文本逐个遍历进行统计。使用字典get方法,已有的字母次数加上,没有字母写入字典。
5、第五步,按统计值进行排序。将字典键值对转化为列表,然后再对列表按值进行降序排列。
6、第六步,按排序结果加入文本后面。使用追加的方式读入文件,然后遍历列表,将字母及对应结果写入文件。