《應用回歸分析第九章部分答案》由會員分享,可在線閱讀,更多相關《應用回歸分析第九章部分答案(17頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第9章 非線性回歸
9.1 在非線性回歸線性化時,對因變量作變換應注意什么問題?
答:在對非線性回歸模型線性化時,對因變量作變換時不僅要注意回歸函數(shù)的形式, 還要注意誤差項的形式。如:
(1) 乘性誤差項,模型形式為,
(2) 加性誤差項,模型形式為。
對乘法誤差項模型(1)可通過兩邊取對數(shù)轉(zhuǎn)化成線性模型,(2)不能線性化。
一般總是假定非線性模型誤差項的形式就是能夠使回歸模型線性化的形式,為了方便通常省去誤差項,僅考慮回歸函數(shù)的形式。
9.2為了研究生產(chǎn)率與廢料率之間的關系,記錄了如表9.14所示的數(shù)據(jù),請畫出散點圖,根據(jù)散點圖的趨勢擬合適當?shù)幕貧w模型。
表9.14
生產(chǎn)
2、率x(單位/周)
1000
2000
3000
3500
4000
4500
5000
廢品率y(%)
5.2
6.5
6.8
8.1
10.2
10.3
13.0
解:先畫出散點圖如下圖:
從散點圖大致可以判斷出x和y之間呈拋物線或指數(shù)曲線,由此采用二次方程式和指數(shù)函數(shù)進行曲線回歸。
(1)二次曲線
SPSS輸出結果如下:
從上表可以得到回歸方程為:
由x的系數(shù)檢驗P值大于0.05,得到x的系數(shù)未通過顯著性檢驗。
由x2的系數(shù)檢驗P值小于0.05,得到x2的系數(shù)通過了顯著性檢驗。
(2)指數(shù)曲線
從上表可以得到回歸
3、方程為:
由參數(shù)檢驗P值≈0<0.05,得到回歸方程的參數(shù)都非常顯著。
從R2值,σ的估計值和模型檢驗統(tǒng)計量F值、t值及擬合圖綜合考慮,指數(shù)擬合效果更好一些。
9.3 已知變量x與y的樣本數(shù)據(jù)如表9.15,畫出散點圖,試用αeβ/x來擬合回歸模型,假設:
(1) 乘性誤差項,模型形式為y=αeβ/xeε
(2) 加性誤差項,模型形式為y=αeβ/x+ε。
表9.15
序號
x
y
序號
x
y
序號
x
y
1
4.20
0.086
6
3.20
0.150
11
2.20
0.350
2
4.06
0.090
7
3.00
0.
4、170
12
2.00
0.440
3
3.80
0.100
8
2.80
0.190
13
1.80
0.620
4
3.60
0.120
9
2.60
0.220
14
1.60
0.940
5
3.40
0.130
10
2.40
0.240
15
1.40
1.620
解: 散點圖:
(1) 乘性誤差項,模型形式為y=αeβ/xeε
線性化:lny=lnα+β/x +ε 令y1=lny, a=lnα,x1=1/x .
做y1與x1的線性回歸,SPSS輸出結果如下:
從以上結果可以得到回歸方程為:y1=-3.8
5、56+6.08x1
F檢驗和t檢驗的P值≈0<0.05,得到回歸方程及其參數(shù)都非常顯著。
回代為原方程為:y=0.021e6.08/x
(2)加性誤差項,模型形式為y=αeβ/x+ε
不能線性化,直接非線性擬合。給初值α=0.021,β=6.08(線性化結果),NLS結果如下:
從以上結果可以得到回歸方程為: y=0.021e6.061/x
根據(jù)R2≈1,參數(shù)的區(qū)間估計不包括零點且較短,可知回歸方程擬合非常好,且其參數(shù)都顯著。
9.4 Logistic回歸函數(shù)常用于擬合某種消費品的擁有率,表8.17(書上239頁,此處略)是北京市每百戶家庭平均擁有的照相機數(shù),
6、試針對以下兩種情況擬合Logistic回歸函數(shù)。
(1)已知,用線性化方法擬合,
(2)u未知,用非線性最小二乘法擬合。根據(jù)經(jīng)濟學的意義知道,u是擁有率的上限,初值可取100;b0>0,0
7、e畫圖:
由圖可知回歸效果比較令人滿意。
(2)非線性最小二乘擬合,取初值,,:
一共循環(huán)迭代8次,得到回歸分析結果為:
>0.994,得到回歸效果比線性擬合要好,且:,,,
回歸方程為:。
最后看擬合效果,由sequence畫圖:
得到回歸效果很好,而且較優(yōu)于線性回歸。9.5表9.17(書上233頁,此處略)數(shù)據(jù)中GDP和投資額K都是用定基居民消費價格指數(shù)(CPI)縮減后的,以1978年的價格指數(shù)為100。
(1) 用線性化乘性誤差項模型擬合C-D生產(chǎn)函數(shù);
(2) 用非線性最小二乘擬合加性誤差項模型的C-D生產(chǎn)函數(shù);
(3) 對線性化檢驗自相關,如果存在
8、自相關則用自回歸方法改進;
(4) 對線性化檢驗多重共線性,如果存在多重共線性則用嶺回歸方法改進;
解:(1)對乘法誤差項模型可通過兩邊取對數(shù)轉(zhuǎn)化成線性模型。
lny=lnA+ a lnK+ b lnL
令y′=lny,β0=lnA,x1=lnK,x2=lnL,則轉(zhuǎn)化為線性回歸方程:
y′=β0+ a x1+ b x2+ e
SPSS輸出結果如下:
模型綜述表
從模型綜述表中可以看到,調(diào)整后的為0.993,說明C-D生產(chǎn)函數(shù)擬合效果很好,也說明GDP的增長是一個指數(shù)模型。
方差分析表
從方差分析表中可以看到,F(xiàn)值很大,P值為零,說明模型通過了檢驗,這與
9、上述分析結果一致。
系數(shù)表
根據(jù)系數(shù)表顯示,回歸方程為:
盡管模型通過了檢驗,但是也可以看到,常數(shù)項沒有通過檢驗,但在這個模型里,當lnK和lnL都為零時,lnY為-1.785,即當K和L都為1時,GDP為0.168,也就是說當投入資本和勞動力都為1個單位時,GDP將增加0.168個單位,這種解釋在我們的承受范圍內(nèi),可以認為模型可以用。
最終方程結果為:
y=0.618K0.801 L0.404
(2) 用非線性最小二乘法擬合加性誤差項模型的C-D生產(chǎn)函數(shù);
上述假設誤差是乘性的,現(xiàn)假設誤差是加性的情況下使用非線性最小二乘法估計。初值采用(1)中參數(shù)的結果
10、,SPSS輸出結果如下:
參數(shù)估計表
SPSS經(jīng)過多步迭代,最終得到的穩(wěn)定參數(shù)值為P=0.407,a=0.868,b=0.270
y=0.407K0.868 L0.270
為了比較這兩個方程,我們觀察下面兩個圖
線性回歸估計擬合曲線圖
非線性最小二乘估計擬合曲線圖
我們知道,乘性誤差相當于是異方差的,做了對數(shù)變換后,乘性誤差轉(zhuǎn)為加性誤差,這種情況下認為方差是相等的,那么第一種情況(對數(shù)變換線性化)就大大低估了GDP數(shù)值大的項,因此,它對GDP前期擬合的很好,而在后期偏差就變大了,同時也會受到自變量之間的自相關和多重共線性的綜合影響;非線性最小二乘法完全依賴
11、數(shù)據(jù),如果自變量之間存在比較嚴重的異方差、自相關以及多重共線性,將對擬合結果造成很大的影響。因此,不排除異方差、自相關以及多重共線性的存在。
(3) 對線性化回歸模型采用DW檢驗自相關,結果如下:
模型綜述表
DW=0.715<1.27,落在自相關的區(qū)間,所以采用迭代法改進
將得到的數(shù)據(jù)再取對數(shù),而后用普通最小二乘法估計,保留DW值
模型綜述表
方差分析表
系數(shù)表
從模型綜述表中可以看到,DW=1.618>1.45,認為消除了自相關;方差分析表中可以看到F值很大,P值為零,說明模型通過了檢驗。
從系數(shù)表可得回歸
12、方程:
再迭代回去,最終得方程為:
Lnyt-Lnyt-1=-1.859+0.755(LnKt-LnKt-1) +0.465(LnLt-LnLt-1)
(4) 對線性化回歸方程通過VIF檢驗多重共線性:
方差分析表
系數(shù)表
多重共線性診斷表
直觀法:從模型綜述表上可以看到,F(xiàn)值很大,而t值很小,這是多重共線性造成的影響;
VIF檢驗法:從系數(shù)表上可以看到,VIF=13>10,也說明多重共線性的存在;
條件數(shù):從診斷表上可以看到,最大的條件數(shù)是429,遠遠大于了100,所以自變量之間存在較為嚴重的多重共線性。
利用嶺回歸改進
13、:
R-SQUARE AND BETA COEFFICIENTS FOR ESTIMATED VALUES OF K
K RSQ LNK LNL
______ ______ ________ ________
.00000 .99394 .860706 .141014
.05000 .99015 .646381 .330432
.10000 .98639 .577758 .375355
.15000 .98
14、260 .539715 .390822
.20000 .97843 .513383 .395623
.25000 .97379 .492922 .395526
.30000 .96869 .475918 .392882
.35000 .96318 .461184 .388818
.40000 .95730 .448063 .383937
.45000 .95109 .436158 .378587
.50000 .94462
15、 .425211 .372979
.55000 .93791 .415047 .367248
.60000 .93101 .405541 .361481
.65000 .92395 .396598 .355735
.70000 .91677 .388147 .350049
從嶺跡圖觀察,當k=0.2時,變量基本趨于穩(wěn)定
取k=0.2進行嶺回歸, SPSS輸出結果為:α=0.479,β=1.127
從嶺回歸給出的結果來看,說明勞動力L較資金K對GDP的影響較大,而我國屬于人口大國,就業(yè)人數(shù)對GDP的貢獻不一定有顯著的影響,相反,資金對GDP的影響按常理來說是非常顯著的,這點普通最小二乘法給出了合理的解釋,但是,嶺回歸在理論上很可信的??傊?,影響統(tǒng)計的因素有很多,例如統(tǒng)計員的失誤、國家政策等,造成函數(shù)系數(shù)的不穩(wěn)定。