PPS抽樣方法在我國出口貿易預測中的應用
佚名 2015-04-21
論文導讀::通過(guò)對我國31個(gè)省市自治區的出口貿易額進(jìn)行不等概率抽樣,抽取了13個(gè)對象作為研究樣本,預測了2008年我國出口貿易總額及抽樣方差,同時(shí)與簡(jiǎn)單隨機抽樣的效果進(jìn)行了對比,結果發(fā)現PPS抽樣方法在總體單元之間差異比較大的情況下,能夠取得很好的估計效果。 論文關(guān)鍵詞:PPS抽樣,簡(jiǎn)單隨機抽樣,出口 一、引言 自2001年中國加入WTO以來(lái),我國的對外貿易得到了飛速的發(fā)展,從2000年,我國的進(jìn)出口總額4743億美元,到2008年則高達25632億美元,比2000年增長(cháng)了5倍多,進(jìn)出口貿易總額以年均16.3%的速度增長(cháng),大大超過(guò)了同期國民經(jīng)濟的年均約11%的增長(cháng)速度。其中,出口貿易作為拉動(dòng)我國經(jīng)濟增長(cháng)的三駕馬車(chē)之一,對促進(jìn)我國綜合國力的提高和保持整個(gè)國民經(jīng)濟健康穩定發(fā)展的作用日趨顯著(zhù)。正因為目前的中國經(jīng)濟對國際市場(chǎng)的依賴(lài)程度越來(lái)越深,為保證宏觀(guān)經(jīng)濟的持續穩定增長(cháng)。出口貿易的增長(cháng)問(wèn)題正受到前所未有的關(guān)注。本文通過(guò)對我國31個(gè)省市自治區的貨物進(jìn)出口總額進(jìn)行不等概率抽樣(PPS抽樣),抽取了8個(gè)省市作為研究樣本,以此來(lái)預測2008年我國各地區出口貿易總額及抽樣方差,并與簡(jiǎn)單隨機抽樣的預測結果進(jìn)行比較,以期得到較為準確的預測結果,為宏觀(guān)決策層更準確地把握各項促進(jìn)出口政策的實(shí)施力度提供依據。 二、PPS抽樣方法簡(jiǎn)介 從抽樣發(fā)展的歷史來(lái)看論文服務(wù),最初提出的是代表性樣本,這是一種主觀(guān)有意識的抽樣。但是,這種方法無(wú)法計算抽樣誤差,因此進(jìn)一步發(fā)展到等概率隨機抽樣,以使總體中的每一個(gè)單元處于平等地位,有同樣的機會(huì )被抽中,從而可以科學(xué)地計算和控制抽樣誤差。當總體單元之間的差異不大時(shí),簡(jiǎn)單隨機抽樣是簡(jiǎn)便的、有效地。但是當總體單元之間的差異非常大時(shí),簡(jiǎn)單隨機抽樣效果并不好,例如,要反映一個(gè)城市的經(jīng)濟發(fā)展情況,大型企業(yè)對城市的影響是比較大的,因而在抽樣中是否抽中這些企業(yè),對推斷總體的結果也有很大影響。而對一些名不見(jiàn)經(jīng)傳的小企業(yè)是否抽中則無(wú)足輕重,因而在抽樣中如果把它們處在同等地位,顯然也是有缺陷的。因此就需要引入不等概率抽樣。 1、不等概率抽樣的基本含義 不等概率抽樣是指在抽取樣本前給總體的每一個(gè)單元賦予一定的被抽中概率。不等概率抽樣分為放回與不放回兩種情況。在有放回的不等概率抽樣中,最常用的是按總體單元的規模大小來(lái)確定抽選的概率。設總體中第個(gè)單元的規模度量為,總體的總規模度量為,則該單元的抽選概率應為。這種不等概率抽樣稱(chēng)作按與規模大小成比例的概率抽樣,英文為probability proportional to size,簡(jiǎn)稱(chēng)PPS抽樣。但是,總體單元大小的度量往往不止一個(gè),比如度量一個(gè)企業(yè)的大小,可以是資金大小,也可以是產(chǎn)值或銷(xiāo)售額的大小,還可以是人員的多少,因此通常用表示規模大小的抽選概率。由于每個(gè)單元均有被抽中的概率,,因此也稱(chēng)作PPZ抽樣。 2、PPS抽樣的實(shí)施方法 PPS抽樣的實(shí)施方法有累積總和法、拉希里方法、規模累積等距抽選的方法和分裂法,本文這里選用規模累積等距抽選的方法。這種方法是在累積和的基礎上采取等距抽樣的方法。具體如下: 設總體單元數為,其規模度量分別為,論文服務(wù),…,,進(jìn)行累積,直至。若欲抽取樣本的容量為n,則先求得等距抽樣的間隔,然后在之間隨即等概率抽取一個(gè)數,假設為,則所在的單元代碼區間相應的單元即為被抽中的單元。以后每隔個(gè)度量值,即等數字所在的單元代碼區間的相應單元,即為被抽中的單元。 這種抽樣方法的特點(diǎn)是當所有單元的度量時(shí),它是不重復的抽樣;當某個(gè)時(shí),則第i個(gè)單元有可能被重復抽中;當時(shí),則第個(gè)單元肯定會(huì )被重復抽中。這種方法抽取樣本比較容易,每個(gè)單元的被抽中概率與的大小成比例,因而在我國得到廣泛的應用。 3.Hansen-Hurvitz估計量 (1)總體總量的估計 1943年,漢森和赫維茨對PPS抽樣提出了估計總體總量的估計量為: 其中為入樣的第個(gè)單元的變量值,為第個(gè)單元根據其規模大小的入樣概率。通常情況下若以該單元包含的元素單位為度量時(shí),,其中,是總體總量的一個(gè)無(wú)偏估計量。 (2)方差估計量為: 三、實(shí)證分析 1、數據收集與處理 各地區按經(jīng)營(yíng)單位所在地分貨物出口總額 單位:萬(wàn)美元
地區
2007年
2008年
地區
2007年
2008年
全 國
121777576
143069307
河 南
837492
1071890
北 京
4892639
5749961
湖 北
817294
1170891
天 津
3807405
4210299
湖 南
651540
841288
河 北
1700041
2400412
廣 東
36931609
40566447
山 西
653249
925312
廣 西
510916
734744
內蒙古
294439
359185
海 南
136446
158720
遼 寧
3532409
4206950
重 慶
450721
572205
吉 林
385706
477163
四 川
860596
1313249
黑龍江
1225712
1680624
貴 州
146547
190078
上 海
14384611
16914514
云 南
476828
498441
江 蘇
20360978
23802941
西 藏
32636
70757
浙 江
12826397
15429623
陜 西
467525
538082
安 徽
881373
1136411
甘 肅
165866
160135
福 建
4993757
5699184
青 海
38591
41910
江 西
544459
772666
寧 夏
108567
125837
山 東
7511011
9319479
新 疆
1150217
1929910
表1中為2007年與2008年各地區按經(jīng)營(yíng)單位所在地分貨物出口總額的原始數據,根據2007年貨物出口總額采用PPS等距抽樣法抽取13個(gè)省市做樣本,以2007年貨物出口總額作為規模,并進(jìn)行累計,得下表。
地區
2007年出口額
累積和
代碼范圍
地區
2007年出口額
累積和
代碼范圍
北 京
4892639
4892639
1~4892639
湖 北
817294
79648972
78831679~79648972
天 津
3807405
8700045
4892640~8700045
湖 南
651540
80300512
79648973~80300512
河 北
1700041
10400085
8700046~10400085
廣 東
36931609
117232121
80300513~117232121
山 西
653249
11053334
10400086~11053334
廣 西
510916
117743036
117232122~117743036
內蒙古
294439
11347774
11053335~11347774
海 南
136446
117879482
117743037~117879482
遼 寧
3532409
14880183
11347775~14880183
重 慶
450721
118330203
117879483~118330203
吉 林
385706
15265888
14880184~15265888
四 川
860596
119190799
118330204~119190799
黑龍江
1225712
16491601
15265889~16491601
貴 州
146547
119337345
119190800~119337345
上 海
14384611
30876211
16491602~30876211
云 南
476828
119814173
119337346~119814173
江 蘇
20360978
51237189
30876212~51237189
西 藏
32636
119846810
119814174~119846810
浙 江
12826397
64063587
51237190~64063587
陜 西
467525
120314334
119846811~120314334
安 徽
881373
64944960
64063588~64944960
甘 肅
165866
120480200
120314335~120480200
福 建
4993757
69938717
64944961~69938717
青 海
38591
120518791
120480201~120518791
江 西
544459
70483176
69938718~70483176
寧 夏
108567
120627359
120518792~120627359
山 東
7511011
77994187
70483177~77994187
新 疆
1150217
121777576
120627360~121777576
河 南
837492
78831678
77994188~78831678
將除以樣本量,得到抽樣間隔。在之間抽一隨機數R=2751684,處于北京的代碼范圍,因此北京作為抽中的樣本。按照規模累積等距抽樣法,依次抽到其他省市,分別是遼寧、上海、江蘇、浙江、福建、山東、廣東。其中廣東作為出口大省被重復抽中4次,則廣東省應入樣4次,應計量4次;上海、江蘇分別被抽中2次,則各入樣2次論文服務(wù),應計量2次。即總共8個(gè)省市入選。 2、總體總量的估計 這8個(gè)省市被抽選的概率為,分別為北京0.0402、遼寧0.0290、上海0.1181、江蘇0.1672、浙江0.1053、福建0.0410、山東0.061678、廣東0.3033,用這8個(gè)樣本省市來(lái)估計2008年全國出口貿易總額,采用漢森—赫維茨估計量,由公式得: 故估計推斷,全國31個(gè)省市2008年出口貿易總額為140837723萬(wàn)美元。 抽樣的方差: 置信度為95%的置信區間為: 即:所以置信區間為(137718364.1~143957081.9) 2008年,這31個(gè)省市的實(shí)際出口貿易總額為143069307萬(wàn)美元,位于置信區間內。 3、與簡(jiǎn)單隨機抽樣估計方法的比較分析 (1) 基于簡(jiǎn)單隨機抽樣的估計 用隨機數抽取13個(gè)地區作為樣本,具體如下所示:
地區
2008年出口額
地區
2008年出口額
天津
4210299
山東
9319479
河北
2400412
湖北
1170891
內蒙古
359185
湖南
841288
上海
16914514
重慶
572205
江蘇
23802941
四川
1313249
福建
5699184
云南
498441
青海
41910
總體總量估計: 總體方差估計: 置信度為95%的置信區間為即 所以置信區間為(63437605.68~256787614.32) 將上面兩種方式估計的結果匯總到下表:
抽樣方式
總體總量的估計量
總體方差的估計值
95%的置信區間
簡(jiǎn)單隨機抽樣
160112610
(63437605.68~256787614.32)
PPS抽樣
140837723
(137718364.1~143957081.9)
實(shí)際值
143069307
四、小結 通過(guò)對2007年我國31個(gè)省市自治區出口貿易額進(jìn)行PPS抽樣,估計出2008年全國出口貿易總額為140837723,置信區間為(137718364.1~143957081.9),而2008年實(shí)際值為143069307,在置信區間內。通過(guò)與簡(jiǎn)單隨機抽樣方法的比較可以看出,無(wú)論是總體總量的估計還是抽樣誤差,PPS抽樣的效果都優(yōu)于簡(jiǎn)單隨機抽樣。所以,對于總體單元之間差異非常大時(shí),用PPS抽樣可以的到更好的估計效果。