残差分析说明 下载本文

残差分析说明

通常在进行ANVOA分析后要接着进行对残差的分析,一直对残差分析里面的四个图表所表现出来的作用迷糊,在这里请教他们分别表现出来的作用,为了说明什么?

1,normal plot of Residuals

2, I chart of Residuals

3, Histogram of Residuals

4, Residuals vs. Fits

残差分析:主要是做进一步的确认;

通常情况下,残差是随机分布在0直线的两侧,应为正态分布。 所以上述四个图形均是为了验证以下内容:

如果残差并非完全正态?

如果在I Chart of Residuals 里表现的数据并非独立? 如果在Residuals vs. Fits 里表现的数据并非有相同的方差? 那么如果出现了以上的情况后,所表达了什么?我们又能在以后做什么?

一般来说,我们大概可以在以下这几个主题中看到要做残差分析: 实验设计、回归、变异数分析。

他们共同的特点就是:有估计一个数学模式。

因为在数学理论的架构上,有一个很重要的假设条件:误差项必须是一个服从常态分配的随机变量。所以在模式建构之后,这个模式的适

用性一定要检查─就是看预测值与实际值的差异,就是残差的部份。 残差的部份一定要符合误差项的基本假设,所以要透过残差图来检视。

如果残差图有特殊现象存在,代表模式的适合度不够,必须重新思考数学模式(因子)的选取是否恰当:可能关键因子没有找到,也有可能是项次的阶数不够(线性、二次式或更高阶)。

简单的说是一个图形化的前面所做合适性的表现

如果残差正态,表示ANOVA合适

我们通常会产生一个数学模型,但是这个模型是否能够真实的反映实际情况,或者说这个数学模型是否是可信的,就需要进行残差和拟合优度的正态性检验。如果具有正态性,说明该数学模型是可行的,比较能够反

当你做ANOVA,DOE,Regression时,你一定是想研究一些因素对某一个质量特性值的影响。当你在做试验时,你必然希望你的质量特性值只受到这些你想研究的因素的影响,所以你会很注意得控制住一些你已经知道的非研究影响因素。但是你是不是能控制住所有的影响因素呢?当然是不可能的,于是你所不知道的一些因素的影响就形成了残差。如果你的残差只受到普通因素(common cause)的影响,它一定是服从Mean值在0上的正态分布。而如果你的残差还受到异常因素(special cause)的影响,它就一定会有一些异常的表现,比如:

非正态,不等方差,i-chart不再随机排列。这也就是告诉你,如果你的残差图出现了这些情况,一定是有什么你不知道的特殊的影响因素对你的实验产生了作用。这个因素有可能是一个别的什么因素,也有可能是你的实验因素的高次,这个判断就要通过残差图来实现了。同时,如果真的有了什么异常因素的影响,你还能相信你的实验结果吗?

残差分析一般只是regression结果分析的一个步骤~

我们得出回归方程后,要确认这个方程是否可信要有三个注意事项:

1)R-squ and R-squ(adj);

2) P值的大小

3 残差分析:包括残差的正态性、线性、独立性、和残差的等分散性

这三点满足的话才说明你的回归方程式是可信的!

而不仅仅只是分析残差!

1,normal plot of Residuals-----是否是正态分布

2, I chart of Residuals----------是否是随机分布

3, Histogram of Residuals-----正态分布的趋势

4, Residuals vs. Fits------------是否有相同的组间方差

残差分析是为了确认实验模型的三个假设是否成立:

1.随机,正态

2.残差的常数方差

3.残差的平均值为零

所以:

1)残差产生的原因可能会有一些没有发现的原因在影响,检验的目的是评价其影响度;

2)残差和拟合优度的检验是以检验的结果是否符合正态分布作为标准;

3)残差分析中所产生的各种图形的含义:正态性、趋向、是否相同的组间方向等

4)需要进行残差分析的过程有:回归、方差等

残差分析的三个假设意义如下:

第一个假设:残差的正态和随机。不用说这是统计计算的基础和前提。 第二个假设:残差的常数方差假设,就是对整个拟合方程或模型的趋

向即各段的均匀分布与否做出判定。举例来说,如果实

际的模型是曲线,而你如果用线性回归的话,就会出现

残差的方差分布是双锤型,如果是喇叭型,可能你所拟

合的线型和实际的分布偏离了。

第三个假设:残差的平均值为0。

这就是怕出现拟合模型虽然与实际的模型趋势模式几乎一样,但是却存在一个平移的GAP。所以要求所有残差总和或平均值接近零