Matlab剔除多变量异常数据,异常数据用0代替。

作者:国际小甜 | 创建时间: 2023-04-21
MATLAB剔除异常数据,对异常数据用0代替的方法采用统计识别法,根据统计学规律给定一个置信概率,并确定置信限,然后采用拉以达准则进行异常值踢除,这里对异常值赋值为0。下面是具体程序和方法步骤。...
Matlab剔除多变量异常数据,异常数据用0代替。

操作方法

首先将样本数据读入到wt矩阵。 程序如下: wt=xlsread('样本数据.xlsx');  %读入样本数据表格 可以打开工作区的变量表查看是否已经读入数据,下面正常读入了数据。

接着计算样本数据的大小 n行 p列 [n,p]=size(wt); 运行结果如下图所示。

再依次将样本数据表中变量一列一列赋值给c_wt,计算平均值,当前值减去平均值(样本数据偏差),计算标准差, 当前值减去平均值(样本数据偏差)的绝对值,与3倍标准差比较,若大于则代表数据异常,将异常值赋值为0,将剔除异常数据后的变量依次一列一列填入ty_wt。 程序代码如下: for c=1:p c_wt=wt(:,c);         %依次将样本数据表中变量一列一列赋值给c_wt c_wtmean=mean(c_wt);       %计算平均值 j=1; for i=1:n vi(i,:)=c_wt(i,:)-c_wtmean;    % 当前值减去平均值(样本数据偏差) stdcwt=std(c_wt);              % 计算标准差 if abs(vi(i,:))>3*stdcwt       % 当前值减去平均值(样本数据偏差)的绝对值与3倍标准差比较,若大于则代表数据异常,执行if后面语句 c_wt(i,:)=0;             % 将异常值赋值为0 c_tbj(j,c)=i;        %标记异常数据的坐标 j=j+1; end end ty_wt(:,c) = c_wt;         %将剔除异常数据后的变量依次一列一列填入ty_wt end 运行结果如下图所示。

然后将剔除异常后数据ty_wt写入到剔除异常后数据Excel表格。 程序如下: xlswrite('剔除异常后数据.xlsx',ty_wt); 运行结果如下图所示。

完整程序代码及截图如下: %*******剔除异常数据,对异常数据用0代替。******************************* %**********采用统计识别法,根据统计学规律给定一个置信概率,并确定置信限,采用拉以达准则****************** wt=xlsread('样本数据.xlsx');  %读入样本数据 [n,p]=size(wt);              %求样本数据的大小 n行,p列 for c=1:p c_wt=wt(:,c);         %依次将样本数据表中变量一列一列赋值给c_wt c_wtmean=mean(c_wt);       %计算平均值 j=1; for i=1:n vi(i,:)=c_wt(i,:)-c_wtmean;    % 当前值减去平均值(样本数据偏差) stdcwt=std(c_wt);              % 计算标准差 if abs(vi(i,:))>3*stdcwt       % 当前值减去平均值(样本数据偏差)的绝对值与3倍标准差比较,若大于则代表数据异常,执行if后面语句 c_wt(i,:)=0;             % 将异常值赋值为0 c_tbj(j,c)=i;        %标记异常数据的坐标 j=j+1; end end ty_wt(:,c) = c_wt;         %将提出异常数据后的变量依次一列一列填入ty_wt end xlswrite('剔除异常后数据.xlsx',ty_wt);  % 将剔除异常后数据ty_wt赋值给剔除异常后数据表格 %**************************************************************************

温馨提示

xlswrite('剔除异常后数据.xlsx',ty_wt);若写不进数据,则改为xlswrite('剔除异常后数据.xls',ty_wt);原因是wps和office后缀。
wt=xlsread('样本数据.xlsx'); 若写不进数据,则改为wt=xlsread('样本数据.xls'); 原因是wps和office后缀。
点击展开全文

更多推荐