統(tǒng)計學教程(含spss)四參數(shù)估計.ppt
《統(tǒng)計學教程(含spss)四參數(shù)估計.ppt》由會員分享,可在線閱讀,更多相關《統(tǒng)計學教程(含spss)四參數(shù)估計.ppt(41頁珍藏版)》請在裝配圖網(wǎng)上搜索。
參數(shù) 估計,用SPSS作參數(shù)估計,抽樣與抽樣分布,區(qū)間估計,點 估 計,參數(shù) 估計,,抽樣方法,,樣本容量與抽樣分布,抽樣分布,抽樣與抽樣分布,,樣本(sample),總體(population),抽樣(sampling),總體容量(population size) N=45,樣本容量(sample size) n=10,為推斷總體的某些特征,而從總體中按一定方法抽取若干個體,這一過程稱為抽樣,所抽取的個體稱為樣本。,,,抽樣方法,自有限總體的簡單隨機抽樣,簡單隨機樣本,有限總體,總體中每一個體以相等的概率被抽出,稱簡單隨機抽樣。有放回抽樣與無放回抽樣之分。自有限總體的簡單隨機抽樣,特指有放回抽樣。,,,,抽樣方法,自無限總體的簡單隨機抽樣,無限總體,自無限總體抽取樣本,采用無放回抽樣。如果滿足以下兩個條件,則稱簡單隨機抽樣: ——每個個體來自同一個總體 ——樣本中每個個體的抽取是獨立的,,簡單隨機樣本,,抽樣方法,統(tǒng)計量,計算,總 體,確定性,樣 本,,隨機抽樣,隨機性,隨機性,樣本統(tǒng)計量做為隨機變量,具有特定的概率分布。 把握住他們的分布規(guī)律就找到了推斷總體參數(shù)的依據(jù)。,,總體參數(shù),理論上可計算,,,確定性,,,抽樣分布,1000名公司員工總體,500個容量為30的簡單隨機樣本的平均年薪、大學畢業(yè)生比率、年薪標準差的分布直方圖。,的分布,,抽樣分布,,,—隨機變量 的數(shù)學期望,—總體均值,—隨機變量 的標準差,—總體的標準差,—樣本容量,—總體容量,設總體均值為μ總體方差為σ2 ,則有:,設總體均值為μ總體方差為σ2 ,則有:,抽樣分布,,總體為正態(tài)概率分布時,對任何樣本容 量的 的分布均為正態(tài)分布。,,中心極限定理(central limit theorem),總體為任意分布,當樣本容量n→∞時, 的抽樣分布為正態(tài)分布。 實踐中n≥30, 的分布 即可用正態(tài)近似。,抽樣分布,中心極限定理作用下 的概率密度,,,,標準正態(tài)分布,,,,,抽樣分布,總體X的分布,樣 本 均值的 分 布,n=2,n=5,n=30,中心極限定理對三個總體作用的圖示,,抽樣分布,,,—總體比率,—隨機變量 p 的標準差,—總體的方差,—樣本容量,—總體容量,—隨機變量p的數(shù)學期望,對于 ,滿足下面兩個條件時認為樣本容量足夠大: —— —— 當樣本容量足夠大時, 的抽樣分布可用正態(tài)近似,即:,,,,,抽樣分布,,,,,,,,,,,,,,,,0.05,0.10,0.15,0.20,0.25,0.30,2600,3400,4200,5000,的分布,,,s2 服從卡方分布,但其分布函數(shù)不便于用數(shù)學式直接表達??梢缘贸雠c其相聯(lián)系的一個服從自由度為 n-1的卡方分布的統(tǒng)計量。,,抽樣分布,,,,與樣本容量有關,與樣本容量無關,,51800,,樣本容量與抽樣分布,點估計的概念,,,估計量的優(yōu)良性,點 估 計,,某連續(xù)生產(chǎn)線上生產(chǎn)的燈泡的使用壽命X服從正態(tài)分布N(μ,δ2),其中μ和δ2是未知總體參數(shù)。從中隨機抽取5只燈泡,測得使用壽命分別為1529小時、1513小時、1600小時、1527小時、1111小時。試估計μ和δ2。,從總體中抽取一個樣本,構造適當?shù)慕y(tǒng)計量 ,來估計對應的總體參數(shù) 。,點估計的概念,,估計量的優(yōu)良性,無偏性,有效性,一致性,,則稱統(tǒng)計量 是總體參數(shù) 的無偏估計量,參數(shù)θ不等于抽樣分布的均值,,,,(有偏估計量),參數(shù)θ等于抽樣分布的均值,(無偏估計量),,偏差,,,如果,,無偏性,,,,,,,,有效性,自正態(tài)總體抽樣時,總體均值與總體中位數(shù)相同,而中位數(shù)的標準誤差大約比均值的標準誤差大25%。因此,樣本均值更有效。,,,,,的抽樣分布,,,的抽樣分布,,有效性,均為一致性估計量,,,,,,,,,兩個無偏點估計量的抽樣分布,兩個不同容量樣本的點估計量的抽樣分布,,,,一致性,總體均值的區(qū)間估計,,總體比率的區(qū)間估計,樣本容量的確定,總體方差的區(qū)間估計,區(qū)間估計,,總體方差已知時總體均值的區(qū)間估計,,總體方差未知時總體均值的區(qū)間估計,總體均值的區(qū)間估計,,總體方差已知時總體均值的區(qū)間估計,,,,,,,,一批零件的長度服從正態(tài)分布,從中隨機抽取9件,測得其平均長度為21.4毫米。已知該批零件長度的標準差為0.15毫米,試以95%的把握程度,估計該批零件平均長度的存在區(qū)間。,總體方差已知時總體均值的區(qū)間估計,某大學從該校學生中隨機抽取100人,調查到他們平均每天參加體育鍛煉為26分鐘。試以95%的置信水平估計該大學全體學生平均每天參加體育鍛煉的時間(已知總體方差為36)。,,總體方差已知時總體均值的區(qū)間估計,,,,,總體方差未知時總體均值的區(qū)間估計,某大學從該校學生中隨機抽取100人,調查到他們平均每天參加體育鍛煉為26分鐘,樣本方差為34。試以95%的置信水平估計該大學全體學生平均每天參加體育鍛煉的時間。,總體方差未知時總體均值的區(qū)間估計,是否為大樣本 n≥30,σ值是否已知,σ值是否已知,總體是否近 似正態(tài)分布,用樣本標準差s 估計δ,用樣本標準差s 估計δ,將樣本容量 增加到n≥30 以便進行區(qū)間 估計,,,,,,,,,,,,,,,,,,是,是,是,是,否,否,否,否,總體均值區(qū)間估計程序,,,,總體均值的區(qū)間估計,,,,,顯著性水平α下,P在1- α置信水平下的置信區(qū)間:,,總體比計的區(qū)間估計,某企業(yè)在一項關于職工流動原因的研究中,從企業(yè)前職工的總體中隨機抽選了200人組成一個樣本。在對其進行訪問時,有140說他們離開該企業(yè)是由于同管理人員不能融洽相處。試對由于這種原因而離開企業(yè)的人員的真正比率構造95%的置信區(qū)間。,,總體比計的區(qū)間估計,,,,允許誤差(permissible),,,用歷史數(shù)據(jù)代替。若有若干個歷史數(shù)據(jù),應以較大者代替。,樣本容量的確定,,,一家廣告公司想估計某類商店去年所花的平均廣告費有多少。經(jīng)驗表明,總體方差為1800000。如置信度取95%,并要使估計值處在總體平均值附近500元的范圍內,這家廣告公司應取多大的樣本?,一家市場調研公司想估計某地區(qū)有彩色電視機的家庭所占的比率。該公司希望對 P 的估計誤差不超過0.05,要求可靠程度為 95%,應取多大容量的樣本?,總體方差最大值為0.5×0.5=0.25,,,,,,,,,,,,總體方差的區(qū)間估計,,顯著性水平α下,σ2 的置信區(qū)間,,,,0,,,,,,,,=8.90655,=32.8523,0.025,0.025,自由度為19的χ2分布,從一批灌裝產(chǎn)品中,隨機抽取20灌,得樣本方差為0.0025。試以95%的置信度,估計總體方差的存在區(qū)間。,,總體方差的區(qū)間估計,0,,,,,,,,,=2.7044,=19.0228,0.025,0.025,自由度為9的χ2分布,對某種金屬的10個樣品所組成的一個隨機樣本作抗拉強度試驗。從試驗數(shù)據(jù)算出的方差為4,試求σ2 的95%值信區(qū)間。,,,總體方差的區(qū)間估計,結 束,關鍵術語,無放回抽樣(sampling without replacement)一個元素一旦選入樣本,就從總體中剔除,不能再次被選入 放回抽抽樣(sampling with replacement)一個元素一旦被選入樣本,仍被放回總體中。先前被選入的元素可能再次被抽到,并且在本樣中可能出現(xiàn)多次 抽樣分布(sampling distribution)樣本統(tǒng)計量所有可能值構成的概率分布 點估計(point estimate)用做總體參數(shù)估計量的值。它是點估計量的具體的取值 點估計量(point estimator)提供總體參數(shù)點估計的樣本統(tǒng)計量 標準誤差(standard error)點估計量的標準差 中心極限定理(central limit theorem)當樣本容量大的時候,用正態(tài)分布近似樣本均值的分布和樣本比率的抽樣分布 區(qū)間估計(interval estimate)總體參數(shù)估計值的一個范圍,確信該范圍包括參數(shù)的值在內 抽樣誤差(sample error)無偏估計值(如樣本均值)與所估計的總體值(如總體均值)之差的絕對值 置信水平(confidence level)與區(qū)間估計相聯(lián)系的置信度 邊際誤差(margin error)置信區(qū)間中從點估計值中所加上或減去的值 t分布(t distribution) 概率分布的一族,當總體是正態(tài)或者近似正態(tài)概率分布,并且總體標準差未知情況下,對總體均值進行區(qū)間估計時常用到該分布 自由度(degrees of freedom)t 分布的參數(shù),計算總體均值的區(qū)間估計中所用的t 分布的自由度為n-1,其中n是簡單單隨機樣本的樣本容量,結 束,案例5-1,某學者估計某城市一個家庭所收到的郵件中大約有70%是廣告。 一個由20個家庭組成的樣本給出了有關它們在一個星期中所收到的郵件的總份份數(shù)及所收到的廣告的份數(shù)的數(shù)據(jù).見數(shù)據(jù)集[案例5-1]。 要求: 1、每周所收到的廣告數(shù)據(jù)數(shù)量的均值的點估計為多少?并求總體均值的95%置信區(qū)間。 2、每周所收到郵件數(shù)量的點估計為多少?并求總體均值的95%置信區(qū)間。 3、由1和2中所得到的點估計與初始所給出的關于70%的郵件是廣告的說法是否一致。,案例5-2,某消費者研究組織,經(jīng)常要對消費者所使用的大量產(chǎn)品和服務進行評估。消費者抱怨,某一汽車制造商所生產(chǎn)的小汽車,在初期的使用過程中,傳動系統(tǒng)不佳。為了更好地了解該種小汽車傳動系統(tǒng)的問題,該消費者研究組織采用該地區(qū)一個汽車修理企業(yè)所提供的實際傳動系統(tǒng)的維修記錄為樣本。如下數(shù)據(jù)是50輛汽車傳動系統(tǒng)出現(xiàn)故障時所行駛的實際里程數(shù)據(jù)。見數(shù)據(jù)集[案例5-2]。 要求: 1、用適當?shù)拿枋鼋y(tǒng)計量匯總傳動系統(tǒng)數(shù)據(jù)。 2、求曾經(jīng)出現(xiàn)過傳動系統(tǒng)問題的汽車總體中在出現(xiàn)傳動系統(tǒng)問題時所行駛里程的均值的95%置信區(qū)間。并對該區(qū)間估計做出管理上的解釋。 3、按照一些汽車用戶曾經(jīng)歷過使用初期傳動系統(tǒng)失靈的說法,你的統(tǒng)計結果說明了什么? 4、如果研究公司想在5000公里的邊際誤差下,估計出現(xiàn)傳動系統(tǒng)問題時所行駛里程的均值,應選取多大的樣本容量?(取置信度為95%。) 5、為了更全面地對該傳動系統(tǒng)問題做出評價,你還需要收集一些某他什么樣的信息?,案例,結 束,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 統(tǒng)計學 教程 spss 參數(shù)估計
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
鏈接地址:http://m.szxfmmzy.com/p-1851216.html