2018-2019年高中數(shù)學 第三章 統(tǒng)計案例 3.2 獨立性檢驗的基本思想及其初步應用 學案學案 新人教A版選修2-3.doc
《2018-2019年高中數(shù)學 第三章 統(tǒng)計案例 3.2 獨立性檢驗的基本思想及其初步應用 學案學案 新人教A版選修2-3.doc》由會員分享,可在線閱讀,更多相關《2018-2019年高中數(shù)學 第三章 統(tǒng)計案例 3.2 獨立性檢驗的基本思想及其初步應用 學案學案 新人教A版選修2-3.doc(9頁珍藏版)》請在裝配圖網(wǎng)上搜索。
3.2 獨立性檢驗的基本思想及其初步應用 [教材研讀] 預習教材P91~96,思考以下問題 1.分類變量與列聯(lián)表分別是如何定義的? 2.獨立性檢驗的基本思想是怎樣的? [要點梳理] 1.與列聯(lián)表相關的概念 (1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量. (2)列聯(lián)表: ①列出的兩個分類變量的頻數(shù)表,稱為列聯(lián)表. ②一般地,假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)為: YX y1 y2 總計 x1 a b a+b x2 c d c+d 總計 a+c b+d a+b+c+d 2.等高條形圖 等高條形圖與表格相比,圖形更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖展示列表數(shù)據(jù)的頻率特征. 3.獨立性檢驗的基本思想 (1)定義:利用隨機變量K2來判斷“兩個分類變量有關系\”的方法稱為獨立性檢驗. (2)公式:K2=,其中n=a+b+c+d. (3)獨立性檢驗的具體做法: ①根據(jù)實際問題的需要確定容許推斷“兩個分類變量有關系”犯錯誤概率的上界α,然后查表確定臨界值k0. ②利用公式計算隨機變量K2的觀測值k. ③如果k≥k0,就推斷“X與Y有關系”,這種推斷犯錯誤的概率不超過α;否則,就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關系”,或者在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠證據(jù)支持結論“X與Y有關系”. [自我診斷] 判斷(正確的打“√”,錯誤的打“”) 1.分類變量中的變量與函數(shù)中的變量是同一概念.( ) 2.列聯(lián)表頻率分析法、等高條形圖可初步分析兩分類變量是否有關系,而獨立性檢驗中K2取值則可通過統(tǒng)計表從數(shù)據(jù)上說明兩分類變量的相關性的大?。? ) 3.獨立性檢驗的方法就是反證法.( ) [答案] 1. 2.√ 3. 題型一 用等高條形圖分析兩個分類變量間的關系 為了解鉛中毒病人與尿棕色素為陽性是否有關系,分別對病人組和對照組的尿液作尿棕色素定性檢查,結果如下: 組別 陽性數(shù) 陰性數(shù) 總計 鉛中毒病人 29 7 36 對照組 9 28 37 總計 38 35 73 試畫出列聯(lián)表的等高條形圖,分析鉛中毒病人和對照組的尿棕色素陽性數(shù)有無差別,鉛中毒病人與尿棕色素為陽性是否有關系? [思路導引] 依據(jù)表中數(shù)據(jù),畫出等高條形圖,由圖形進行分析. [解] 等高條形圖如圖所示: 其中兩個淺色條的高分別代表鉛中毒病人和對照組樣本中尿棕色素為陽性的頻率. 由圖可以直觀地看出鉛中毒病人與對照組相比,尿棕色素為陽性的頻率差異明顯,因此鉛中毒病人與尿棕色素為陽性有關系. (1)判斷兩個分類變量是否有關系的兩種常用方法 ①利用數(shù)形結合思想,借助等高條形圖來判斷兩個分類變量是否相關是判斷變量相關的常見方法. ②一般地,在等高條形圖中,與相差越大,兩個分類變量有關系的可能性就越大. (2)利用等高條形圖判斷兩個分類變量是否相關的步驟 [跟蹤訓練] 在調查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分別利用圖形和獨立性檢驗的方法來判斷色盲與性別是否有關?你所得到的結論在什么范圍內有效? [解] 根據(jù)題目所給的數(shù)據(jù)作出如下的列聯(lián)表: 色盲 不色盲 總計 男 38 442 480 女 6 514 520 總計 44 956 1000 根據(jù)列聯(lián)表作出相應的等高條形圖,如圖所示. 從等高條形圖來看,男性患色盲的頻率要高一些,因此直觀上可以認為色盲與性別有關. 根據(jù)列聯(lián)表中所給的數(shù)據(jù)可以有 a=38,b=442,c=6,d=514,a+b=480,c+d=520, a+c=44,b+d=956,n=1000, 由公式K2=, 得K2的觀測值 k=≈27.1>10.828. 因此,在犯錯誤的概率不超過0.001的前提下,認為色盲與性別是有關的. 題型二 用22列聯(lián)表分析兩個分類變量間的關系 思考:下面是22列聯(lián)表. y1 y2 總計 x1 33 21 54 x2 a 13 46 總計 b 34 100 則表中a,b處的值應為多少? 提示:a=46-13=33,b=33+a=33+33=66. 為了探究學生選報文、理科是否與對外語的興趣有關,某同學調查了361名高二在校學生,調查結果如下:理科對外語有興趣的有138人,無興趣的有98人,文科對外語有興趣的有73人,無興趣的有52人.能否在犯錯誤的概率不超過0.1的前提下,認為“學生選報文、理科與對外語的興趣有關”? [解] 根據(jù)題目所給的數(shù)據(jù)得到如下列聯(lián)表: 理科 文科 總計 有興趣 138 73 211 無興趣 98 52 150 總計 236 125 361 根據(jù)列聯(lián)表中數(shù)據(jù)由公式計算得隨機變量K2的觀測值 k=≈1.87110-4. 因為1.87110-4<2.706, 所以在犯錯誤的概率不超過0.1的前提下,不能認為“學生選報文、理科與對外語的興趣有關”. 獨立性檢驗的步驟 (1)確定分類變量,獲取樣本頻數(shù),得到列聯(lián)表. (2)根據(jù)實際問題的需要確定容許推斷“兩個分類變量有關系”犯錯誤概率的上界α,然后查表確定臨界值k0. (3)利用公式K2=計算隨機變量K2的觀測值k0. (4)作出判斷. 如果k≥k0,就推斷“X與Y有關系”,這種推斷犯錯誤的概率不超過α,否則就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y的關系”,或者在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠證據(jù)支持結論“X與Y有關系”. [跟蹤訓練] 在研究某種藥物對“H1N1”病毒的治療效果時,進行動物試驗,得到以下數(shù)據(jù),對150只動物服用藥物,其中132只動物存活,18只動物死亡,對照組150只動物進行常規(guī)治療,其中114只動物存活,36只動物死亡. (1)根據(jù)以上數(shù)據(jù)建立一個22列聯(lián)表; (2)試問該種藥物對治療“H1N1”病毒是否有效? [解] (1)22列聯(lián)表如下: 存活數(shù) 死亡數(shù) 總計 服用該藥物 132 18 150 未服該藥物 114 36 150 總計 246 54 300 (2)由(1)知 K2=≈7.317>6.635. 故在犯錯誤的概率不超過0.01的前提下認為該種藥物對“H1N1”病毒有治療效果. 某高校共有學生15000人,其中男生10500人,女生4500人,為調查該校學生每周平均體育運動時間的情況,采用分層抽樣的方法,收集300位學生每周平均體育運動時間的樣本數(shù)據(jù)(單位:小時). (1)應收集多少位女生的樣本數(shù)據(jù)? (2)根據(jù)這300個樣本數(shù)據(jù),得到學生每周平均體育運動時間的頻率分布直方圖(如圖所示),其中樣本數(shù)據(jù)的分組區(qū)間為:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估計該校學生每周平均體育運動時間超過4小時的概率. (3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運動時間超過4小時.請完成每周平均體育運動時間與性別的列聯(lián)表,并判斷是否有95%的把握認為“該校學生的每周平均體育運動時間與性別有關\”. 附:K2= P(K2≥k0) 0.10 0.05 0.010 0.005 k0 2.706 3.841 6.635 7.879 [解] (1)300=90,所以應收集90位女生的樣本數(shù)據(jù). (2)由頻率分布直方圖得2(0.150+0.125+0.075+0.025)=0.75, 所以該校學生每周平均體育運動時間超過4小時的概率的估計值為0.75. (3)由(2)知,300位學生中有3000.75=225人的每周平均體育運動時間超過4個小時,75人的每周平均體育運動時間不超過4個小時.又因為樣本數(shù)據(jù)中有210份是關于男生的,90份是關于女生的,所以每周平均體育運動時間與性別的列聯(lián)表如下: 平均體育運動時間與性別列聯(lián)表 男生 女生 總計 每周平均體育運動時間 不超過4個小時 45 30 75 每周平均體育運動時間 超過4個小時 165 60 225 總計 210 90 300 結合列聯(lián)表可算得K2的觀測值 k==≈4.762>3.841. 有95%的把握認為“該校學生的每周平均體育運動時間與性別有關”. (1)獨立性檢驗問題是常與統(tǒng)計、概率相結合,解題時一定要認真審題,找出各數(shù)據(jù)的聯(lián)系. (2)解決獨立性檢驗的應用問題,一定要按照獨立性檢驗的步驟得出結論. [跟蹤訓練] 某中學將100名高一新生分成水平相同的甲、乙兩個“平行班”,每班50人.陳老師采用A,B兩種不同的教學方式分別在甲、乙兩個班級進行教改實驗.為了解教學效果,期末考試后,陳老師分別從兩個班級中各隨機抽取20名學生的成績進行統(tǒng)計,作出莖葉圖如圖.記成績不低于90分者為“成績優(yōu)秀”. (1)在乙班樣本的20個個體中,從不低于86分的成績中隨機抽取2個,求抽出的兩個均“成績優(yōu)秀”的概率; (2)由以上統(tǒng)計數(shù)據(jù)作出列聯(lián)表,并判斷能否在犯錯誤的概率不超過0.1的前提下認為:“成績優(yōu)秀”與教學方式有關. [解] (1)由題意知本題是一個等可能事件的概率,試驗發(fā)生包含的事件是從不低于86分的成績中隨機抽取兩個包含的基本事件是:(86,93),(86,96),(86,97),(86,99),(86,99),(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共有15種結果, 符合條件的事件數(shù)(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共有10種結果,根據(jù)等可能事件的概率得到P==. (2)由已知數(shù)據(jù)得 甲班 乙班 總計 成績優(yōu)秀 1 5 6 成績不優(yōu)秀 19 15 34 總計 20 20 40 根據(jù)列聯(lián)表中的數(shù)據(jù),計算得隨機變量K2的觀測值 k=≈3.137, 由于3.137>2.706,所以在犯錯誤的概率不超過0.1的前提下認為:“成績優(yōu)秀”與教學方式有關. 1.本節(jié)課的重點是用22列聯(lián)表、等高條形圖分析兩個分類變量間的關系以及獨立性檢驗. 2.本節(jié)課要重點掌握的規(guī)律方法 (1)用等高條形圖分析兩個分類變量間的關系,見典例1; (2)用22列聯(lián)表分析兩個分類變量間的關系,見典例2; (3)獨立性檢驗,見典例3. 3.解決一般的獨立性檢驗問題的步驟 (1)通過列聯(lián)表確定a,b,c,d,n的值,根據(jù)實際問題需要的可信程度確定臨界值k0; (2)利用K2=求出K2的觀測值k; (3)如果k≥k0,就推斷“兩個分類變量有關系”,這種推斷犯錯誤的概率不超過α,否則就認為在犯錯誤的概率不超過α的前提下不能推斷“兩個分類變量有關系”. 其中第(2)步易算錯K2的值,是本節(jié)課的易錯點.- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 2018-2019年高中數(shù)學 第三章 統(tǒng)計案例 3.2 獨立性檢驗的基本思想及其初步應用 學案學案 新人教A版選修2-3 2018 2019 年高 數(shù)學 第三 統(tǒng)計 案例 獨立性 檢驗 基本 思想 及其
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
相關資源
更多
正為您匹配相似的精品文檔
鏈接地址:http://m.szxfmmzy.com/p-6241920.html