专栏名称: 生活统计学
平台致力于将统计学基础与生活实例联系起来,带大家走进生活统计学的世界。介绍统计软件SPSS/SAS/Minitab的生活统计运用技巧。
目录
相关文章推荐
苏州新闻  ·  别羡慕!央妈也来支持苏州队了!你呢? ·  9 小时前  
苏州新闻  ·  别羡慕!央妈也来支持苏州队了!你呢? ·  9 小时前  
虎扑足球 HUPU Football  ·  四年六冠两进欧冠决赛,你如何评价小因扎吉在国 ... ·  昨天  
虎扑足球 HUPU Football  ·  四年六冠两进欧冠决赛,你如何评价小因扎吉在国 ... ·  昨天  
938重庆私家车广播  ·  国足生死战,这次免费播! ·  昨天  
938重庆私家车广播  ·  国足生死战,这次免费播! ·  昨天  
51好读  ›  专栏  ›  生活统计学

实验分析技术:重复测量和重复实验的区别,用Minitab说明两者混用可能出现的后果

生活统计学  · 公众号  ·  · 2019-11-17 23:58

正文

请到「今天看啥」查看全文



工程师根据生产经验,考虑四个主要的影响因素温度(A)、时间(B)、压强(C)和气流(D),每个因素(因子)设置两个实验水平(高水平和低水平),那么总共有16种实验条件组合:


如果在每个实验组合上进行一次实验,每次实验使用相同的制备炉,每次实验制备炉内放置4片相同的硅片,制备结束后,测量每片硅片表面的氧化物厚度,得到四个氧化物厚度数据,这四个数据就称为4次重复测量数据。 如果每个实验组合安排四次实验,总共安排64次实验,每次实验,相同的制备炉中只放置1片硅片,那么每个实验组合的四次实验同样可以得到四个硅片的氧化物厚度数据,这四个厚度数据称为重复实验数据。
很容易想到,重复测量的四个数据对比重复实验的四个数据,前者的方差或者标准差(数据波动)是小于后者的,这是因为重复测量的数据是在同一个实验中完成的,数据波动只包含了同个实验内的变异信息,称为实验内变异; 而重复实验的数据,是在不同次实验中获得的,数据波动反应的是实验间的差异。
通过上面的描述,大家判断实验数据是重复测量数据还是重复实验数据,可以根据这些数据是一次实验获得的还是相同条件但不同次实验获得的来区分。


误用的后果
大家很容易将重复测量数据和重复实验数据相互误用,这可能会导致分析结果的错误,这是因为方差分析中,判断一种效应是否显著,使用的是F统计量,如下所示:


如果将重复测量数据错误用成重复实验数据,那么随机误差均方差就等于实验内误差,也就是说随机误差均方差被低估了,F值变大,有可能会造成有些原本不显著的效应变成显著,得到错误的结论。


案例分析
继续沿用上方的案例,某半导体硅片工厂的精益工程师设计了一个2^4析因设计,希望通过这个实验设计得到最佳工艺条件,尽量减少硅片上附着氧化物厚度。 他进行的实验是重复测量实验,也就是在一个炉子中放置4片硅片,数据应该整理成下面的形式:


如果是分析者错误的将重复测量数据当作重复实验数据,那么数据就变成下面的形式,总共进行64次实验,每次实验后面有一个数据,如下图所示(只截取部分数据):


我们将上述数据导入minitab软件中,可以得到下面两个文件,如下图所示,是重复测量数据的存储形式,事先计算出四个重复测量数据的均值和标准差;
(可前往qq群:577312904和134373751下载案例数据)


下图是重复实验数据,重复实验数据不需要事先计算平均值和标准差。






请到「今天看啥」查看全文