《《元方差分析》PPT課件.ppt》由會員分享,可在線閱讀,更多相關《《元方差分析》PPT課件.ppt(50頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、二、二元方差分析,一 、一元方差分析,第六章,方差分析,二、統(tǒng)計分析,一 、總平方和的分解,第一節(jié),單因素試驗的方差分析,例1 假定某型號的電子管的使用壽命服從正態(tài)分布,并且原料差異只影響平均壽命,不影響方差 ?,F(xiàn)用三種不同來源的材料各試生產(chǎn)了一批電子管。從每批中各抽取若干只做壽命實驗,得數(shù)據(jù)如下表。,試問測試結果是否說明這批電子管的壽命有明顯差異?,1.引例,三個水平,因素,試驗指標,例2 設對四種玉米品種進行對比實驗,每個品種都在同一塊田的五個小區(qū)各做一次實驗,實驗結果如下表所示。試問不同品種對玉米的平均產(chǎn)量是否有顯著影響?,水平,因素,試驗指標,設在試驗中,因素A有m個不同水平,在水平下
2、的試驗結果,其中 和 是未知參數(shù)。在水平 下作 次獨立實驗,其結果如表1所示。,2. 數(shù)學模型,表1,是來自總體 的容量為 的 一個 樣本,其觀察值為,(1),由于 相互獨立,且,若記,則,且相互獨立,要判斷因素的各水平間是否有顯著差異,也就是要 判斷各正態(tài)總體的均值是否相等,即檢驗假設,(2),其中 與 均為未知參數(shù)。 式(2)稱為單因素方差分析的數(shù)學模型。,(3),再令,(5),則是各水平下總體均值的加權平均,稱為總平均值;,代表了第i水平下的總體均值與平均值的差異,這個差異稱為 的效應,,(4),由式(2),(3)可以得到單因素方差分析的等價數(shù)學模型,它滿足,式(5)表明:樣本由總平均值
3、 因素的水平效應 隨機誤差三部分疊加而成。 因而式(5)也稱為線性可加模型。,(5),由于當 為真時,,=各水平的效應,=統(tǒng)計假設模型(1)等價于,(6),基本任務:根據(jù)樣本提供的信息,對假設 (6)進行檢驗,并估計未知參數(shù),檢驗此假設的方法就是方差分析,3. 總離差平方和的分解:,樣本總平均,通過分解,構造統(tǒng)計量,組內平均,(7),(8),兩者間的關系,稱為總離差平方和。,引入記號,(10),總離差平方和分解,全部數(shù)據(jù)與總平均之間的差異,又叫總變差,其中,為各水平下的樣本與該水平下樣本均值的離差平方和,反映了各水平下樣本值的隨機波動情況,稱為組內平方和。 它是由試驗的隨機誤差引起的,故又稱誤
4、差平方和。,為各水平下的樣本均值與樣本總均值的(加權)離差平方和,反映了各水平間的樣本值的差異,稱為組間平方和。 形成它的主要原因是因素A的各水平下的不同效應,故又稱為效應平方和。,常見統(tǒng)計量,1、樣本均值,2、樣本方差,設,是來自總體X的一個樣本,,常用來估計EX.,復習,結論:設 為來自總體 的一個樣本,,4. SE,SA的統(tǒng)計特性,故,(12),(13),記,(14),(15),的均方,的均方,4. SE,SA的統(tǒng)計特性,(14),(15),(14)及(15)兩式表明:,是 的無偏估計,,僅當,成立時才是 的無偏估計,,否則它的期望值要大于,在 成立時應接近于1,,而當 H1成立時總有偏
5、大的傾向。,如果比值,比1大得多,就應拒絕假設,為此,我們采用,(16),作為檢驗統(tǒng)計量。,當 成立時,,與,相互獨立,且分別服從自由度,(n-m),(m-1)的 分布,故,復習:F 分布的分位點,對于給定的正數(shù),稱滿足條件,的點,為,分位點,分布的上,對給定的顯著性水平 ,由,得檢驗問題(1.1)或(1.6)的拒絕域為,(17),上述分析的結果可排列成表2的形式稱為方差分析表,在實際計算時,通常使用下列公式,其中,例1,設對四種玉米品種進行對比實驗,每個品種都在同一塊田的五個小區(qū)各做一次實驗,實驗結果如下表所示。試問不同品種對玉米的平均產(chǎn)量是否有顯著影響?(=0.01),解,分別以 表示不同
6、品種玉米平均產(chǎn)量總體的均值,按題意需檢驗假設,品種,地塊,產(chǎn)量,1 32.3 33.3 30.8 29.3,172.1 173.9 168.5 141.9 656.4,5 36.5 34.5 35.8 28.8,4 35.0 36.8 32.3 28.0,3 34.3 36.3 35.3 29.8,2 34.0 33.0 34.3 26.0,5923.682 6048.242 5678.45 4027.122 21677.50,29618.41 30241.21 28392.25 20135.61,5933.03 6060.07 5696.15 4035.97 21725.22,注意到,可得方
7、差分析表,方差分析表,方差來源,誤差E,因素A,總和,均 方,自由度,平方和,顯著性,F 比,當 時,,由F分布表可查得,由于,故拒絕,即認為,這四個品種對玉米平均產(chǎn)量的影響高度顯著。,3,19,16,若檢驗結果為原假設H0不成立,,有時需要對,則 的置信度為1 的置信區(qū)間為,由上面討論,可得未知參數(shù),的估計,是 的無偏估計。,5.未知參數(shù)的估計,如果檢驗結果為拒絕 ,,即,不全相等。,有時需要對第i個水平及第k個水平均值差 作出區(qū)間估計。,為此,我們可以取,作為 的點估計,,注意到,又,是 的無偏估計,,而,可以證明 與 相互獨立。,的置信度為 的置信區(qū)間為,求例2中未知參數(shù) 的點估計及均值
8、差的置信度為0.95的區(qū)間估計。,解,的點估計為,及 的無偏估計分別為,例2,當,時,,的置信度為0.95的置信,區(qū)間分別為,因素A分3個水平,對每個水平進行4次試驗,結果如下表:,假定樣本都是從同方差的正態(tài)總體中抽取的。,(1)在顯著性水平 下,檢驗假設,組均值相等。,(2)求未知參數(shù),及,的點估計以及均值差的置信區(qū)間(置信度為95%),例3,解,(1)用下表進行計算,方差分析表,查表得,拒絕,即在顯著性水平 下,可以認為組平,均值在整體上是有顯著差異的。,(2),查表,的置信度為95%的置信區(qū)間分別為,一共進行了13次試驗,假設樣本都是從同方差的正態(tài)總體中抽取的,試驗結果如下表:,(1)在顯著性水平 下檢驗假設,(2)求 及 的點估計及均值,差的95%置信區(qū)間。,例4,解,用下表進行計算,得,方差分析表,(1)查表得,拒絕,在顯著性水平 下,,可以認為3個水平下的期望有顯著差異。,(2),又,由,得,的置信區(qū)間為,即 (67.1, 7.1)。,由,可得,的置信區(qū)間為,即 (78.6, 7.4)。,由,可得,的置信區(qū)間為,即 (38.9,26.9)。,