2020版高考數(shù)學(xué)一輪復(fù)習(xí) 第9章 算法初步、統(tǒng)計與統(tǒng)計案例 第4節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計案例教學(xué)案 理(含解析)新人教A版
-
資源ID:104749077
資源大?。?span id="24d9guoke414" class="font-tahoma">2.81MB
全文頁數(shù):12頁
- 資源格式: DOC
下載積分:22積分
快捷下載

會員登錄下載
微信登錄下載
微信掃一掃登錄
友情提示
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網(wǎng)頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無水印,預(yù)覽文檔經(jīng)過壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標(biāo)題沒有明確說明有答案則都視為沒有答案,請知曉。
|
2020版高考數(shù)學(xué)一輪復(fù)習(xí) 第9章 算法初步、統(tǒng)計與統(tǒng)計案例 第4節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計案例教學(xué)案 理(含解析)新人教A版
第四節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計案例
[考綱傳真] 1.會做兩個有關(guān)聯(lián)變量的數(shù)據(jù)的散點圖,并利用散點圖認識變量間的相關(guān)關(guān)系.2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程(線性回歸系數(shù)公式不要求記憶).3.了解回歸分析的基本思想、方法及其簡單應(yīng)用.4.了解獨立性檢驗(只要求2×2列聯(lián)表)的思想、方法及其初步應(yīng)用.
1.兩個變量的線性相關(guān)
(1)正相關(guān)
在散點圖中,點散布在從左下角到右上角的區(qū)域,對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān).
(2)負相關(guān)
在散點圖中,點散布在從左上角到右下角的區(qū)域,兩個變量的這種相關(guān)關(guān)系稱為負相關(guān).
(3)線性相關(guān)關(guān)系、回歸直線
如果散點圖中點的分布從整體上看大致在一條直線附近,就稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.
2.回歸方程
(1)最小二乘法:使得樣本數(shù)據(jù)的點到回歸直線的距離的平方和最小的方法叫做最小二乘法.
(2)回歸方程:方程=x+是兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)的回歸方程,其中,是待定參數(shù).
3.回歸分析
(1)定義:對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法.
(2)樣本點的中心
對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其中(,)稱為樣本點的中心.
(3)相關(guān)系數(shù)
當(dāng)r>0時,表明兩個變量正相關(guān);
當(dāng)r<0時,表明兩個變量負相關(guān).
r的絕對值越接近于1,表明兩個變量的線性相關(guān)性越強.r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關(guān)關(guān)系.通常|r|大于0.75時,認為兩個變量有很強的線性相關(guān)性.
4.獨立性檢驗
(1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這類變量稱為分類變量.
(2)列聯(lián)表:列出兩個分類變量的頻數(shù)表,稱為列聯(lián)表.假設(shè)有兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為
2×2列聯(lián)表
y1
y2
總計
x1
a
b
a+b
x2
c
d
c+d
總計
a+c
b+d
a+b+c+d
構(gòu)造一個隨機變量K2=,其中n=a+b+c+d為樣本容量.
[常用結(jié)論]
1.回歸直線必過樣本點的中心(,).
2.當(dāng)兩個變量的相關(guān)系數(shù)|r|=1時,兩個變量呈函數(shù)關(guān)系.
[基礎(chǔ)自測]
1.(思考辨析)判斷下列結(jié)論的正誤.(正確的打“√”,錯誤的打“×”)
(1)“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的水平成正相關(guān)關(guān)系.( )
(2)通過回歸直線方程=x+可以估計預(yù)報變量的取值和變化趨勢.( )
(3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進行相關(guān)性檢驗.( )
(4)事件X,Y關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的K2的觀測值越大.( )
[答案] (1)√ (2)√ (3)× (4)√
2.在兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的相關(guān)指數(shù)R2如下,其中擬合效果最好的是( )
A.模型1的相關(guān)指數(shù)R2為0.98
B.模型2的相關(guān)指數(shù)R2為0.80
C.模型3的相關(guān)指數(shù)R3為0.50
D.模型4的相關(guān)指數(shù)R2為0.25
A [R2越接近于1,其擬合效果越好.]
3.已知回歸直線的斜率的估計值是1.23,樣本點的中心為(4,5),若自變量的值為10,則因變量的值約為( )
A.16.3 B.17.3
C.12.38 D.2.03
C [設(shè)回歸直線方程為=x+,根據(jù)已知得5=1.23×4+,所以=0.08,所以當(dāng)x=10時,=1.23×10+0.08=12.38.]
4.下面是一個2×2列聯(lián)表
y1
y2
總計
x1
a
21
73
x2
2
25
27
總計
b
46
則表中a,b處的值分別為________.
52,54 [因為a+21=73,所以a=52.又因為a+2=b,所以b=54.]
5.為了判斷高中三年級學(xué)生是否選修文科與性別的關(guān)系,現(xiàn)隨機抽取50名學(xué)生,得到如下2×2列聯(lián)表:
理科
文科
男
13
10
女
7
20
已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.
根據(jù)表中數(shù)據(jù),得到K2的觀測值k=≈4.844.則認為選修文科與性別有關(guān)系出錯的可能性為________.
5% [K2的觀測值k≈4.844,這表明小概率事件發(fā)生.根據(jù)假設(shè)檢驗的基本原理,應(yīng)該斷定“是否選修文科與性別之間有關(guān)系”成立,并且這種判斷出錯的可能性約為5%.]
相關(guān)關(guān)系的判斷
1.已知變量x和y近似滿足關(guān)系式y(tǒng)=-0.1x+1,變量y與z正相關(guān).下列結(jié)論中正確的是( )
A.x與y正相關(guān),x與z負相關(guān)
B.x與y正相關(guān),x與z正相關(guān)
C.x與y負相關(guān),x與z負相關(guān)
D.x與y負相關(guān),x與z正相關(guān)
C [由y=-0.1x+1,知x與y負相關(guān),即y隨x的增大而減小,又y與z正相關(guān),所以z隨y的增大而增大,減小而減小,所以z隨x的增大而減小,x與z負相關(guān).]
2.對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關(guān)于其相關(guān)系數(shù)的比較,正確的是( )
A.r2<r4<0<r3<r1
B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1
D.r2<r4<0<r1<r3
A [由相關(guān)系數(shù)的定義以及散點圖可知r2<r4<0<r3<r1.]
3.x和y的散點圖如圖所示,則下列說法中所有正確命題的序號為________.
①x,y是負相關(guān)關(guān)系;
②在該相關(guān)關(guān)系中,若用y=c1ec2x擬合時的相關(guān)指數(shù)為R,用=x+擬合時的相關(guān)指數(shù)為R,則R>R;
③x,y之間不能建立線性回歸方程.
①② [在散點圖中,點散布在從左上角到右下角的區(qū)域,因此x,y是負相關(guān)關(guān)系,故①正確;由散點圖知用y=c1ec2x擬合比用=x+擬合效果要好,則R>R,故②正確;x,y之間可以建立線性回歸方程,但擬合效果不好,故③錯誤.]
[規(guī)律方法] 判定兩個變量正、負相關(guān)性的方法
(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關(guān);點的分布從左上角到右下角,兩個變量負相關(guān).
(2)相關(guān)系數(shù):r>0時,正相關(guān);r<0時,負相關(guān).
(3)線性回歸直線方程中:
回歸分析
【例1】 (2018·廣州一模)某地1~10歲男童年齡xi(歲)與身高的中位數(shù)yi(cm)(i=1,2,…,10)如下表:
x/歲
1
2
3
4
5
6
7
8
9
10
y/cm
76.5
88.5
96.8
104.1
111.3
117.7
124.0
130.0
135.4
140.2
對上表的數(shù)據(jù)作初步處理,得到下面的散點圖及一些統(tǒng)計量的值.
(xi-)2
(yi-)2
(xi-)(yi-)
5.5
112.45
82.50
3 947.71
566.85
(1)求y關(guān)于x的線性回歸方程(回歸方程系數(shù)精確到0.01);
(2)某同學(xué)認為,y=px2+qx+r更適宜作為y關(guān)于x的回歸方程類型,他求得的回歸方程是=-0.30x2+10.17x+68.07.經(jīng)調(diào)查,該地11歲男童身高的中位數(shù)為145.3 cm.與(1)中的線性回歸方程比較,哪個回歸方程的擬合效果更好?
附:回歸方程=+x中的斜率和截距的最小二乘估計公式分別為=,=-.
[解] (1)==≈6.87,
=-≈112.45-6.87×5.5≈74.67,
所以y關(guān)于x的線性回歸方程為=6.87x+74.67.
(2)若回歸方程為=6.87x+74.67,
當(dāng)x=11時,=150.24.
若回歸方程為=-0.30x2+10.17x+68.07,
當(dāng)x=11時,=143.64.
因為|143.64-145.3|=1.66<|150.24-145.3|=4.94,
所以回歸方程=-0.30x2+10.17x+68.07對該地11歲男童身高中位數(shù)的擬合效果更好.
[規(guī)律方法] 1.求回歸直線方程的步驟
2.(1)若已知回歸直線方程(方程中無參數(shù))進行預(yù)測時,把變量x代入回歸直線方程即可對變量y進行估計.
(2)若回歸直線方程中有參數(shù),則根據(jù)回歸直線一定經(jīng)過點(,)求出參數(shù)值,得到回歸直線方程,進而完成預(yù)測.
(1)(2017·山東高考)為了研究某班學(xué)生的腳長x(單位:厘米)和身高y(單位:厘米)的關(guān)系,從該班隨機抽取10名學(xué)生,根據(jù)測量數(shù)據(jù)的散點圖可以看出y與x之間有線性相關(guān)關(guān)系.設(shè)其回歸直線方程為=x+.已知xi=225,yi=1 600,=4.該班某學(xué)生的腳長為24,據(jù)此估計其身高為( )
A.160 B.163
C.166 D.170
(2)某產(chǎn)品的廣告費用x萬元與銷售額y萬元的統(tǒng)計數(shù)據(jù)如表:
廣告費用x(萬元)
2
3
4
5
銷售額y(萬元)
26
m
49
54
根據(jù)上表可得回歸方程=9x+10.5,則m的值為( )
A.36 B.37
C.38 D.39
(1)C (2)D [(1)∵xi=225,∴=xi=22.5.
∵yi=1 600,∴=y(tǒng)i=160.
又=4,∴=-=160-4×22.5=70.
∴回歸直線方程為=4x+70.
將x=24代入上式得=4×24+70=166.
故選C.
(2)由回歸方程的性質(zhì),線性回歸方程過樣本點的中心,則:=×9+10.5,
解得m=39.故選D.]
獨立性檢驗
【例2】 (2018·全國卷Ⅲ)某工廠為提高生產(chǎn)效率,開展技術(shù)創(chuàng)新活動,提出了完成某項生產(chǎn)任務(wù)的兩種新的生產(chǎn)方式.為比較兩種生產(chǎn)方式的效率,選取40名工人,將他們隨機分成兩組,每組20人.第一組工人用第一種生產(chǎn)方式,第二組工人用第二種生產(chǎn)方式.根據(jù)工人完成生產(chǎn)任務(wù)的工作時間(單位:min)繪制了如圖所示的莖葉圖:
(1)根據(jù)莖葉圖判斷哪種生產(chǎn)方式的效率更高?并說明理由;
(2)求40名工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)m,并將完成生產(chǎn)任務(wù)所需時間超過m和不超過m的工人數(shù)填入下面的列聯(lián)表:
超過m
不超過m
第一種生產(chǎn)方式
第二種生產(chǎn)方式
(3)根據(jù)(2)中的列聯(lián)表,能否有99%的把握認為兩種生產(chǎn)方式的效率有差異?
附:K2=,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
[解] (1)第二種生產(chǎn)方式的效率更高.
理由如下:
(i)由莖葉圖可知:用第一種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務(wù)所需時間至少80分鐘,用第二種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務(wù)所需時間至多79分鐘.因此第二種生產(chǎn)方式的效率更高.
(ⅱ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)為85.5分鐘,用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)為73.5分鐘.因此第二種生產(chǎn)方式的效率更高.
(ⅲ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)平均所需時間高于80分鐘;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)平均所需時間低于80分鐘.因此第二種生產(chǎn)方式的效率更高.
(ⅳ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間分布在莖8上的最多,關(guān)于莖8大致呈對稱分布;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間分布在莖7上的最多,關(guān)于莖7大致呈對稱分布.又用兩種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間分布的區(qū)間相同,故可以認為用第二種生產(chǎn)方式完成生產(chǎn)任務(wù)所需的時間比用第一種生產(chǎn)方式完成生產(chǎn)任務(wù)所需的時間更少.因此第二種生產(chǎn)方式的效率更高.
(以上給出了4種理由,答出其中任意一種或其他合理理由均可)
(2)由莖葉圖知m==80.
列聯(lián)表如下:
超過m
不超過m
第一種生產(chǎn)方式
15
5
第二種生產(chǎn)方式
5
15
(3)由于K2==10>6.635,所以有99%的把握認為兩種生產(chǎn)方式的效率有差異.
[規(guī)律方法] 1.在2×2列聯(lián)表中,如果兩個變量沒有關(guān)系,則應(yīng)滿足ad-bc≈0.|ad-bc|越小,說明兩個變量之間關(guān)系越弱;|ad-bc|越大,說明兩個變量之間關(guān)系越強.
2.解決獨立性檢驗的應(yīng)用問題,一定要按照獨立性檢驗的步驟得出結(jié)論.獨立性檢驗的一般步驟:
(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表;
(2)根據(jù)公式
(3)比較觀測值k與臨界值的大小關(guān)系,作統(tǒng)計推斷.
某研究型學(xué)習(xí)小組調(diào)查研究學(xué)生使用智能手機對學(xué)習(xí)的影響.部分統(tǒng)計數(shù)據(jù)如下表:
使用智能手機
不使用智能手機
合計
學(xué)習(xí)成績優(yōu)秀
4
8
12
學(xué)習(xí)成績不優(yōu)秀
16
2
18
估計
20
10
30
附表:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
經(jīng)計算K2的觀測值為10,則下列選項正確的是( )
A.有99.5%的把握認為使用智能手機對學(xué)習(xí)有影響
B.有99.5%的把握認為使用智能手機對學(xué)習(xí)無影響
C.有99.9%的把握認為使用智能手機對學(xué)習(xí)有影響
D.有99.9%的把握認為使用智能手機對學(xué)習(xí)無影響
A [依題意,注意到7.879<10<10.828,因此有99.5%的把握認為使用智能手機對學(xué)習(xí)有影響,故選A.]
1.(2015·全國卷Ⅰ)某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響.對近8年的年宣傳費xi和年銷售量yi(i=1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.
(xi-)2
(wi-)2
(xi-)(yi-)
(wi-)·(yi-)
46.6
563
6.8
289.8
1.6
1 469
108.8
表中wi=,w]=wi.
(1)根據(jù)散點圖判斷,y=a+bx與y=c+d哪一個適宜作為年銷售量y關(guān)于年宣傳費x的回歸方程類型?(給出判斷即可,不必說明理由)
(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;
(3)已知這種產(chǎn)品的年利潤z與x,y的關(guān)系為z=0.2y-x.根據(jù)(2)的結(jié)果回答下列問題:
①年宣傳費x=49時,年銷售量及年利潤的預(yù)報值是多少?
②年宣傳費x為何值時,年利潤的預(yù)報值最大?
附:對于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其回歸直線v=α+βu的斜率和截距的最小二乘估計分別為=,=-.
[解] (1)由散點圖可以判斷,y=c+d適宜作為年銷售量y關(guān)于年宣傳費x的回歸方程類型.
(2)令w=,先建立y關(guān)于w的線性回歸方程.
由于===68,
=- =563-68×6.8=100.6,
所以y關(guān)于w的線性回歸方程為=100.6+68w,
因此y關(guān)于x的回歸方程為=100.6+68.
(3)①由(2)知,當(dāng)x=49時,
年銷售量y的預(yù)報值=100.6+68=576.6,
年利潤z的預(yù)報值=576.6×0.2-49=66.32.
②根據(jù)(2)的結(jié)果知,年利潤z的預(yù)報值
=0.2(100.6+68)-x=-x+13.6+20.12.
所以當(dāng)==6.8,即x=46.24時,取得最大值.
故年宣傳費為46.24千元時,年利潤的預(yù)報值最大.
2.(2017·全國卷Ⅱ)海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下:
(1)設(shè)兩種養(yǎng)殖方法的箱產(chǎn)量相互獨立,記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg,新養(yǎng)殖法的箱產(chǎn)量不低于50 kg”,估計A的概率;
(2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān);
箱產(chǎn)量<50 kg
箱產(chǎn)量≥50 kg
舊養(yǎng)殖法
新養(yǎng)殖法
(3)根據(jù)箱產(chǎn)量的頻率分布直方圖,求新養(yǎng)殖法箱產(chǎn)量的中位數(shù)的估計值(精確到0.01).
附:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
,
K2=.
[解] (1)記B表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg”,C表示事件“新養(yǎng)殖法的箱產(chǎn)量不低于50 kg”.
由題意知P(A)=P(BC)=P(B)P(C).
舊養(yǎng)殖法的箱產(chǎn)量低于50 kg的頻率為
(0.012+0.014+0.024+0.034+0.040)×5=0.62,
故P(B)的估計值為0.62.
新養(yǎng)殖法的箱產(chǎn)量不低于50 kg的頻率為
(0.068+0.046+0.010+0.008)×5=0.66,
故P(C)的估計值為0.66.
因此,事件A的概率估計值為0.62×0.66=0.409 2.
(2)根據(jù)箱產(chǎn)量的頻率分布直方圖得列聯(lián)表
箱產(chǎn)量<50 kg
箱產(chǎn)量≥50 kg
舊養(yǎng)殖法
62
38
新養(yǎng)殖法
34
66
K2=≈15.705.
由于15.705>6.635,故有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān).
(3)因為新養(yǎng)殖法的箱產(chǎn)量頻率分布直方圖中,箱產(chǎn)量低于50 kg的直方圖面積為
(0.004+0.020+0.044)×5=0.34<0.5,
箱產(chǎn)量低于55 kg的直方圖面積為
(0.004+0.020+0.044+0.068)×5=0.68>0.5,
故新養(yǎng)殖法產(chǎn)量的中位數(shù)的估計值為
50+≈52.35(kg).
- 12 -