《語言統(tǒng)計第四章離中趨勢與差異量數(shù)》由會員分享,可在線閱讀,更多相關(guān)《語言統(tǒng)計第四章離中趨勢與差異量數(shù)(30頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、單擊此處編輯母版標(biāo)題樣式,*,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,第一節(jié) 離中趨勢與差異量數(shù),一、離中趨勢的概念,二、差異量數(shù)的作用,三.主要的差異量數(shù)分類,第二節(jié) 兩極差,一、兩極差的概念,二、兩極差的求法,第三節(jié) 四分差,一、四分差的概念,二、四分差的求法,第四節(jié) 平均差,一、平均差的概念,二、平均差的求法,第五節(jié) 標(biāo)準(zhǔn)差與方差,一、標(biāo)準(zhǔn)差與方差的概念,二、標(biāo)準(zhǔn)差與方差的求法,第六節(jié) 標(biāo)準(zhǔn)差的應(yīng)用數(shù)據(jù)的標(biāo)準(zhǔn)化,一、考分比較,二、標(biāo)準(zhǔn)化與標(biāo)準(zhǔn)分,三、標(biāo)準(zhǔn)分的應(yīng)用,四、標(biāo)準(zhǔn)分與正態(tài)分布
2、和百分位的關(guān)系,第四章 離中趨勢與差異量數(shù),第一節(jié) 離中趨勢與差異量數(shù),一、離中趨勢的概念:,離中趨勢指的是一組數(shù)據(jù)的變異或離散程度。對離中趨勢進(jìn)行度量的統(tǒng)計量稱作差異量數(shù)。離中趨勢的度量是描述統(tǒng)計的一個重要方面。,二、差異量數(shù)的作用:,1.能從另一個角度了解數(shù)據(jù)的性質(zhì)。,2.有助于檢驗或說明集中量數(shù)的代表性,差異量數(shù)越大,集中量數(shù)的代表性就越??;,差異量數(shù)越小,集中量數(shù)的代表性就越大;,差異量數(shù)為零,那么說明數(shù)據(jù)中各個數(shù)值之間沒有任何差異,都等于平均數(shù),平均數(shù)的代表性最大,三.主要的差異量數(shù)分類:,1.;兩極差 2.四分差 3.平均差 4.標(biāo)注差與方差,舉個例子:,我們兩組假設(shè)的分?jǐn)?shù)來舉個例
3、子:,第一組:60 75 78 80 82 85 100,第二組:74 77 80 80 80 83 86,兩組分?jǐn)?shù)段餓平均差都是80,然而其離散程度卻差異很大,如果每組數(shù)據(jù)中的最大值與最小值之差來表示離散程度,那么第一組為100-60=40,第二組為86-74=12。兩者離散程度的不同說明其分?jǐn)?shù)分布的差異;,第二節(jié) 兩極差,一、概念,兩極差也稱全距,用符號R表示。所謂兩極差就是一組數(shù)據(jù)中最高值與最低值之差。,二、兩極差的求法,R=最大數(shù)值-最小數(shù)值,三、小結(jié):,1.兩極差是簡單而粗略的差異量數(shù),2.不能反映中間數(shù)值的差異情況,也受兩極,端異常數(shù)值的影響。,3.可以作為數(shù)據(jù)分布的初步統(tǒng)計,在一
4、定程度上反映數(shù)據(jù)的差異情況前提是分布比較對稱、沒有極端數(shù)值,第三節(jié) 四分差,一、概念,四分差指一個分布中,中間50%的次數(shù)的全距之半,用符號Q表示。,正如中數(shù)把一個次數(shù)分布分成兩半那樣,有一些點把一個次數(shù)分布分成四等份,這些點稱作四分點或四分位數(shù)。第一個四分點或稱下25分點用Q1表示,其下有全部數(shù)值的1/4或25%,其上那么有全部數(shù)值的3/4或75%,其上那么有全部數(shù)值的1/4或25%。,二.四分差的求法,要求四分差,首先要求Q1和Q3的值。對于分組數(shù)據(jù),用以下公式求之方法同中數(shù)的求法,其實中數(shù)就是第二個四分點,式中Lb-該四分點所在組的精確下限;,fQ1,fQ3-該四分點所在組的次數(shù);,fb
5、-該四分點所在以下的累積次數(shù);,N-數(shù)據(jù)中的數(shù)值個數(shù);,i-組距,:N=100,i=5;,Q1的位置為N/4=25,即在1014組,該組的精確下限為9.5/,該組以下的累積次數(shù)(Fb為8;,我們下面以表,4.1,的分組數(shù)據(jù)未說明四分差的計算過程:,Q3的位置為3N/4=75,即在2529組,改組的精確下為24.5。該組以下的累積次數(shù)Fb)為72;,三、小結(jié),分差不受兩極端值的影響,故兩極差穩(wěn)定可靠,不能反映全部數(shù)據(jù)的差異情況,而且不適于代數(shù)運算,適用于兩極端數(shù)據(jù)不清,無法計算其他差異量數(shù);,四分差常與中數(shù)結(jié)適宜用,第四節(jié) 平均差,一、概念,平均差:是指一組數(shù)據(jù)中各個數(shù)值與平均數(shù)之差的平均實質(zhì)上
6、是用數(shù)值離開平均數(shù)的距離來表示離散程度,一般用符號AD表示。,二、平均差的求法:,平均差是基于算術(shù)平均數(shù)上的一個差異量數(shù),而根據(jù)算術(shù)平均數(shù)的一個重要性質(zhì),一組數(shù)據(jù)中每個數(shù)值與算術(shù)平均數(shù)的差即離均差之和等于零即(),因此求平均差時,要取離均差的絕對值。,對于未分組數(shù)據(jù),首先要計算每個數(shù)值的離均差,取其絕對值,然后把所有離均差相加,再除以數(shù)值的個數(shù)。公式表示如下:,例如10學(xué)生在一次完型填空練習(xí)中的得分為總分值20分,9,11,12,12,15,15,16,16,17,18,即以每組組中點代表該組各數(shù)值。首先計算組中點與平均數(shù)之差,取其絕對值,再乘以該組次數(shù),然后把各組的計算結(jié)果累加,最后除以總次
7、數(shù),N.,以表,4.2,中的數(shù)據(jù)為例,.,三、小結(jié),1.,平均差的優(yōu)點,平均差優(yōu)于兩極差和四分差,用數(shù)值離開平均數(shù)數(shù)的平均距離來表示數(shù)據(jù)的分散程度,符合人們的常識,易于理解和接受。,它的計算考慮了每一個數(shù)值,因而穩(wěn)定可靠,不易受極端數(shù)值的影響也不易受樣本變化的影響。,2.,缺點,計算過程中需要取絕對值等原因,它不適合代數(shù)方法的運算,因而在進(jìn)一步的統(tǒng)計分析中很少使用。,第五節(jié) 標(biāo)準(zhǔn)差與方差,一、概念,標(biāo)準(zhǔn)差是度量離中趨勢的最常用的差異量數(shù)。作為樣本統(tǒng)計量的標(biāo)準(zhǔn)差一般用符號S或者SD表示,而作為總體參數(shù)的標(biāo)準(zhǔn)那么用希臘字母。標(biāo)準(zhǔn)差的平方即為方差,分別用符號S2(樣本統(tǒng)計量和2總體參數(shù)來表示。,二、
8、標(biāo)準(zhǔn)差與方差的求法,下面就從未分組數(shù)據(jù)原始數(shù)據(jù)、次數(shù)分布數(shù)據(jù)和分組次數(shù)分布數(shù)據(jù)三個方面討論一下標(biāo)準(zhǔn)差和方差的計算方法。,1.未分組數(shù)據(jù)標(biāo)準(zhǔn)差和方差的求法,第一步:計算個數(shù)值與平均數(shù)之差離均差,第二步:求離均差的平方,第三步:把平方離均差相加,求平方和“;,第四步:把平方和除以數(shù)值的個數(shù),求得方差;,第五步:方差的平方根即為標(biāo)準(zhǔn)差。用公式表示:,顯然,由于涉及到平均數(shù),上述公式使用起來很不方便;我們可以在上述的公式的根底上得出一個不涉及平均數(shù)的求標(biāo)準(zhǔn)差的公式:,下面我們?nèi)杂蒙侠械臄?shù)據(jù)說明公式的用法,三個公式計算結(jié)果一樣,但計算過程要簡便得多。,2.,次數(shù)分布數(shù)據(jù)標(biāo)準(zhǔn)差和方差的求法:,如果已有次
9、數(shù)分布表,那么標(biāo)準(zhǔn)差和方差的計算將更加簡便。計算公式為:,3.,分組次數(shù)分布數(shù)據(jù)標(biāo)準(zhǔn)差和方差的求法,從分組次數(shù)分布數(shù)據(jù)標(biāo)準(zhǔn)差和方差的公式如下:,三、小結(jié),標(biāo)準(zhǔn)差與方差的概念易于理解,適于代數(shù)運算,能反映所有數(shù)據(jù)的差異情況,不易受抽樣變動的影響。,第六節(jié) 標(biāo)準(zhǔn)差的應(yīng)用,數(shù)據(jù)的標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)差的重要應(yīng)用之一是對數(shù)值型數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。在語言和語言教學(xué)研究中,標(biāo)準(zhǔn)化處理的主要用途是便于對考試分?jǐn)?shù)的比較。,一、考分比較,考分在各自分?jǐn)?shù)組中所處的相對位置是可以進(jìn)行比較的。雖然這同樣無法保證百分之百的可比性,但這至少為比較不同考試的分?jǐn)?shù)找到了一個較為可靠的途徑。,二、標(biāo)準(zhǔn)化與標(biāo)準(zhǔn)分,我們可以用公式表示這一標(biāo)準(zhǔn)
10、化過程:,該式表示:先從一個分?jǐn)?shù)中減去平均分,求出該分?jǐn)?shù)離開平均分的距離分?jǐn)?shù)低于平均數(shù)時,差為負(fù)數(shù);反之為正數(shù),然后再除以標(biāo)準(zhǔn)差,即得標(biāo)準(zhǔn)分。,標(biāo)準(zhǔn)分具有以下幾個特點:,三、標(biāo)準(zhǔn)分的應(yīng)用,通過把原始分?jǐn)?shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分,原分?jǐn)?shù)不見了,而代之以一個抽象的相對位置標(biāo)準(zhǔn)分無實際單位,這樣就可以用同一把尺子來衡量和比較不同考試因而不同質(zhì)的分?jǐn)?shù)。,利用標(biāo)準(zhǔn)分,可以把不同質(zhì)的考試分?jǐn)?shù)合成求和或平均數(shù),然后再加以比較。,四、標(biāo)準(zhǔn)分與正態(tài)分布和百分位的關(guān)系,百分位是指把一組分?jǐn)?shù)從高到低排列并分為100等分,以百分位等級表示某個分?jǐn)?shù)在全局部數(shù)中所在的位置,即在全部考分仲有百分之幾的分?jǐn)?shù)是低于該分?jǐn)?shù)的或有百分之幾的分
11、數(shù)是高于該分?jǐn)?shù)的。,百分位表是在累計次數(shù)分布表的根底上編制的,標(biāo)準(zhǔn)分就是通過標(biāo)準(zhǔn)化把一個成呈正態(tài)分布的變量轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布。在正態(tài)分布的情況下,分布曲線下任意兩個標(biāo)準(zhǔn)之間的面積、任一標(biāo)準(zhǔn)以上的買年紀(jì)或任一標(biāo)準(zhǔn)差以下的面積在總面積中的百分比都是一樣的。,總結(jié),離中趨勢指的是一組數(shù)據(jù)的變異或離散程度。對離中趨勢進(jìn)行度量的統(tǒng)計量稱作差異量數(shù)。離中趨勢的度量是描述統(tǒng)計的一個重要方面。,本章首先介紹了差異量數(shù)的作用:1.能從另一個角度了解數(shù)據(jù)的性質(zhì)。2.有助于檢驗或說明集中量數(shù)的代表性。,其次重點介紹了差異量數(shù)的四種分類以及各種分類的求法,這四種分類分別是:1.兩極差;2.四分差;3.平均差;4.標(biāo)注差與方差。,最后論述了標(biāo)準(zhǔn)差的應(yīng)用數(shù)據(jù)的標(biāo)準(zhǔn)化。而數(shù)據(jù)的標(biāo)準(zhǔn)化主要是指對考試分?jǐn)?shù)的比較。,