使用excel做数据分析时,如何处理重复数据
工具/原料
wps2019
用计数函数countif查重(情况1)
1、如图所示,首先用COUNTIF进行统计,看A2单元格的学号在D列出现了几次,如果没有出现的话就是没选课,反之就是已选课。因滠锖斟绸此用COUNTIF(D:D,A2)>0作为IF的条件,如果学号在D列出现了(出现次数大于0),那么返回"已选课"(注意汉字要加引号),否则返回空白(两个引号代表空白)。
2、选中任一单元格输入:=IF(COUNTIF(D:D,A2)>0,"已选课","")
3、回车键确定
4、选中结果项,鼠标置于单元格右下角出现“十”下拉标识时,下拉应用公式至该列;结果如图,所有选课学号即可筛选完成;
用计数函数countif查重(情况2)
1、重复选课的学号如何查找:比如A列是来自多个人员登记的统计表,汇总后发现有一些是重复的
2、现在需要在B列对有重复的学号进行标注:=IF(COUNTIF(A:A,A2)>1,"有",""),(解释:计算每个学号在A列出现的次剞麽苍足数,要将条件改变,只有出现次数大于1的才是重复学号,因此使用COUNTIF(A:A,A2)>1作为条件,再让IF返回我们需要的结果“有”)
3、如果有重复的则保留一个:=IF(COU鲍伊酷雪NTIF($A$2:A2,A2)=1,"保留","")(注意:这里的COUNTIF,范围不再是整列,而是$A$2:A2)
4、使用“=COUNTIF($A$2:A2,A2)”,则采用计数方式查重复,值为1的数为不重复的数据,其他值则可以通过筛选功能进行删除;
筛选
1、使用筛选功能进行上述操作:开始-筛选-高级筛选
2、选择“将筛选结果复制到其他位置”,在“复制到“文本框区域,选择“选择不重复记录”
3、点击【确定】,效果图即为排重后的数据