1、首先将样本数据读入到wt矩阵。程序如下:wt=xlsread('样本数据.xlsx'); %读入样本数据表格可以打开工作区的变量表查看是否已经读入数据,下面正常读入了数据。
2、接着计算样本数据的大小 n行 p列[n,p]=size(wt); 运行结果如下图所示。
3、再依次将样本数据表中变量一列一列赋值给c_wt,计算平均值,当前值减去平均值(样本数据偏差),计算标准差,当前值减去平均值叵萤茆暴(样本数据偏差)的绝对值,与3倍标准差比较,若大于则代表数据异常,将异常值赋值为0,将剔除异常数据后的变量依次一列一列填入ty_wt。程序代码如下:for c=1:p c_wt=wt(:,c); %依次将样本数据表中变量一列一列赋值给c_wt c_wtmean=mean(c_wt); %计算平均值 j=1; for i=1:n vi(i,:)=c_wt(i,:)-c_wtmean; % 当前值减去平均值(样本数据偏差) stdcwt=std(c_wt); % 计算标准差 if abs(vi(i,:))>3*stdcwt % 当前值减去平均值(样本数据偏差)的绝对值与3倍标准差比较,若大于则代表数据异常,执行if后面语句 c_wt(i,:)=0; % 将异常值赋值为0 c_tbj(j,c)=i; %标记异常数据的坐标 j=j+1; end endty_wt(:,c) = c_wt; %将剔除异常数据后的变量依次一列一列填入ty_wtend运行结果如下图所示。
4、然后将剔除异常后数据ty_wt写入到剔除异常后数据Excel表格。程序如下:xlswrite('剔除异常后数据.xlsx',ty_wt); 运行结果如下图所示。
5、完整程序代码及截图如下:%涯箨唁峦*******剔除异常数据,对异常数据用0代替。*******************************%**********采用统计识别法,根据统计学规律给定一个置信概率,并确定置信限,采用拉以达准则******************wt=xlsread('样本数据.xlsx'); %读入样本数据[n,p]=size(wt); %求样本数据的大小 n行,p列for c=1:p c_wt=wt(:,c); %依次将样本数据表中变量一列一列赋值给c_wt c_wtmean=mean(c_wt); %计算平均值 j=1; for i=1:n vi(i,:)=c_wt(i,:)-c_wtmean; % 当前值减去平均值(样本数据偏差) stdcwt=std(c_wt); % 计算标准差 if abs(vi(i,:))>3*stdcwt % 当前值减去平均值(样本数据偏差)的绝对值与3倍标准差比较,若大于则代表数据异常,执行if后面语句 c_wt(i,:)=0; % 将异常值赋值为0 c_tbj(j,c)=i; %标记异常数据的坐标 j=j+1; end endty_wt(:,c) = c_wt; %将提出异常数据后的变量依次一列一列填入ty_wtendxlswrite('剔除异常后数据.xlsx',ty_wt); % 将剔除异常后数据ty_wt赋值给剔除异常后数据表格%**************************************************************************