暨南大學(xué)陳光慧主持完成的國家社會科學(xué)基金項目《超總體模型輔助條件下抽樣估計方法及其應(yīng)用研究》(項目批準號為:14CTJ014),最終成果為同名論文集。課題組成員有:馬志華、容越彥、曹偉偉、閆單單、楊檳羽。
一 研究的目的和意義
在整個抽樣調(diào)查過程中,抽樣設(shè)計和抽樣估計是影響抽樣精度最主要,也是最具技術(shù)性的兩個環(huán)節(jié)。抽樣設(shè)計研究如何從總體中抽出一個隨機樣本以更好地代表總體,在實際調(diào)查中一般使用復(fù)雜抽樣設(shè)計。國內(nèi)外對此研究非常成熟,理論也相當完善。抽樣估計是在抽樣設(shè)計環(huán)節(jié)之后,基于樣本信息研究應(yīng)用什么樣的抽樣估計方法對總體未知參數(shù)進行推斷估計。相對來說,抽樣估計方面的研究還遠不夠充分和完善。
1.研究目的
在既定的調(diào)查經(jīng)費和樣本信息下,通過改進抽樣估計方法得出更優(yōu)的估計結(jié)果,這對于提高數(shù)據(jù)質(zhì)量的貢獻是潛在和巨大的。本項目理論研究目的在于,尋找現(xiàn)有抽樣估計中難以解決的關(guān)鍵技術(shù)問題,通過構(gòu)建一套現(xiàn)代抽樣回歸估計方法的基礎(chǔ)理論體系,改進抽樣估計效率,為提高調(diào)查數(shù)據(jù)質(zhì)量奠定方法論基礎(chǔ)。
近年來,我國政府統(tǒng)計部門在抽樣框、聯(lián)網(wǎng)直報、“一套表”和復(fù)雜抽樣設(shè)計等方面做了大量工作,但在抽樣估計方面考慮得并不多。本項目應(yīng)用研究目的在于,在當前形勢下針對產(chǎn)生統(tǒng)計數(shù)據(jù)的最大源頭,即政府抽樣調(diào)查體系進行研究,重點解決抽樣估計問題,構(gòu)建適應(yīng)我國統(tǒng)計管理體制的抽樣估計體系,潛在地提高數(shù)據(jù)質(zhì)量。
2.研究意義
(1)在理論方面,本項目拓寬了傳統(tǒng)抽樣估計方法的研究范疇,在超總體模型輔助條件下研究一套抽樣估計方法,將傳統(tǒng)的回歸理論與抽樣估計結(jié)合起來,在兩者的交叉領(lǐng)域進行研究,使得在既定的樣本信息下產(chǎn)生更加準確的估計結(jié)果。(2)在應(yīng)用方面,本項目成果可為政府統(tǒng)計部門改革和完善抽樣方法提供借鑒和參考。比如基于復(fù)雜抽樣設(shè)計的廣義回歸估計方法、連續(xù)月度調(diào)查下的校準組合估計方法,這些必將有效指導(dǎo)我國開展統(tǒng)計調(diào)查工作,產(chǎn)生更加準確的調(diào)查數(shù)據(jù)。
二 成果的主要內(nèi)容、重要觀點及創(chuàng)新之處
1.主要內(nèi)容
本項目以超總體模型為基礎(chǔ),圍繞如何產(chǎn)生更加準確的抽樣估計問題展開研究,將模型輔助下的廣義回歸估計與模型誤差設(shè)定、復(fù)雜抽樣設(shè)計、多水平模型、連續(xù)性樣本輪換調(diào)查結(jié)合起來得出精度更高的估計結(jié)果,并與我國實際抽樣調(diào)查結(jié)合起來,構(gòu)建一套適應(yīng)國情的抽樣回歸估計方法體系。
(1)為了改進模型識別的效果,在模型形式方面,根據(jù)輔助變量與研究變量之間的關(guān)系,將現(xiàn)行的線性回歸模型擴展到非線性、半?yún)?shù)和非參數(shù)模型。本部分在現(xiàn)有研究的基礎(chǔ)上,借鑒數(shù)理統(tǒng)計的最新研究成果,利用前沿的建模方法,研究建立一套模型體系,涵蓋各種模型形式,為后續(xù)回歸估計提供模型基礎(chǔ)。
(2)為了增強估計方法的推廣價值,在上述一般性模型體系下進行系統(tǒng)性的模型輔助抽樣估計研究。包括:將目前的比率估計、線性回歸估計、非參數(shù)估計等各種方法統(tǒng)一在廣義回歸估計體系下進行研究;根據(jù)樣本信息識別出恰當?shù)哪P托问剑⑼ㄟ^上述廣義回歸估計體系得出具體的回歸估計量,如在非參數(shù)模型下應(yīng)用局部多項式回歸估計,不需太多的模型假定,更接近實際調(diào)查情況。
(3)為了提高模型估計效果,在上述廣義回歸估計體系下,對估計方法進行改進研究。在模型設(shè)定方面,改變超總體模型誤差項的方差結(jié)構(gòu),從理論上對現(xiàn)行方法進行擴展;在誤差項方差函數(shù)中考慮各種復(fù)雜抽樣設(shè)計的影響,將抽樣設(shè)計引入估計量中;利用校準估計思想,對回歸系數(shù)和權(quán)重系數(shù)進行最優(yōu)化校準,得出廣義校準回歸(組合)估計方法。
(4)針對復(fù)雜抽樣下的估計難題,引入多水平模型(Multilevel)進行廣義多水平回歸估計。本部分在現(xiàn)行的組回歸模型和單因素方差分析基礎(chǔ)上,考慮各階抽樣單元的水平差異和各群單元的類別差異,建立綜合的多水平模型,通過度量多層次樣本中的各層、各群和各階的影響,分層次開展廣義回歸估計,提高復(fù)雜抽樣下的整體估計精度。
(5)基于輪換樣本調(diào)查研究廣義回歸組合估計方法。首先,對于常見的輪換樣本調(diào)查,基于已有的平衡輪換模式研究廣義組合估計方法,利用各期信息更準確度量輪換樣本間的相關(guān)關(guān)系,得出有效性更高的估計量;其次,在廣義組合估計基礎(chǔ)上,利用各期輔助信息構(gòu)建回歸模型,進行廣義回歸組合估計。另外,還與校準估計方法結(jié)合,提出校準組合估計方法,進一步提高估計精度。
(6)針對我國抽樣調(diào)查在估計環(huán)節(jié)存在的不足,建立適應(yīng)政府管理體制的模型輔助抽樣估計方法體系。利用上述研究的理論方法,并借鑒發(fā)達國家建設(shè)抽樣估計系統(tǒng)的成功經(jīng)驗,研究內(nèi)容有:面對大數(shù)據(jù)時代的機遇與挑戰(zhàn),提出現(xiàn)代政府統(tǒng)計調(diào)查體系改革的思路和建議;結(jié)合我國各類調(diào)查使用的復(fù)雜設(shè)計、輪換模式,構(gòu)建具體的超總體模型,確定具體的模型輔助廣義回歸估計的程序和步驟。
2.重要觀點
(1)利用輔助信息進行模型識別,構(gòu)建恰當?shù)某傮w回歸模型進行輔助估計;(2)放寬模型假定條件,將現(xiàn)行的線性回歸估計拓展到半?yún)?shù)、非參數(shù)估計的研究范疇,引入校準估計等方法改進廣義回歸估計;(3)將傳統(tǒng)的一階抽樣估計擴展到復(fù)雜抽樣下的多階估計;(4)研究近似模型無偏和一致的方差估計量,提高方差估計效果;(5)在各類實際調(diào)查中應(yīng)用這一套模型輔助抽樣估計體系,實現(xiàn)連續(xù)各期協(xié)調(diào)運作,提高估計效率,全面、準確地提供抽樣調(diào)查數(shù)據(jù)。
3.創(chuàng)新之處
(1)關(guān)于模型回歸系數(shù)的樣本估計問題。本項目在估計回歸系數(shù)時,在主流的加權(quán)最小二乘估計法的基礎(chǔ)上,綜合利用復(fù)雜抽樣設(shè)計的包含概率、模型誤差項方差函數(shù)的信息,并校準樣本權(quán)重,得出更加準確的模型回歸系數(shù)估計量,以解決這一重點問題。(2)在連續(xù)性抽樣設(shè)計下構(gòu)建超總體模型進行廣義回歸組合估計。在連續(xù)抽樣估計方面,以往主要是應(yīng)用組合估計法,未考慮建立模型。本項目通過校準估計方法,使用現(xiàn)期和過去各期的輔助信息,研究模型輔助下的廣義校準組合估計方法,并根據(jù)實際情況應(yīng)用到各類連續(xù)性樣本輪換調(diào)查中。(3)結(jié)合我國政府調(diào)查的實際需要,應(yīng)用模型輔助抽樣估計方法。本項目結(jié)合大數(shù)據(jù)時代的特征,將這一套估計方法與現(xiàn)行政府抽樣調(diào)查的組織機構(gòu)、調(diào)查制度、調(diào)查內(nèi)容、調(diào)查指標等方面改革相結(jié)合,綜合考慮各方面的制約因素和阻力,在多方博弈中尋求調(diào)查制度與方法的更優(yōu)平衡點,提高這套理論方法的實際應(yīng)用價值。
三 成果的價值
該成果的學(xué)術(shù)價值在于:在借鑒西方國家前沿的抽樣估計方法研究成果基礎(chǔ)上,進行系統(tǒng)性的改進和創(chuàng)新,最終形成了一系列較為科學(xué)、合理的模型輔助抽樣估計方法體系,這套估計方法體系為我國政府統(tǒng)計的應(yīng)用研究奠定了扎實的理論基礎(chǔ)。
該成果的應(yīng)用價值在于:針對我國當前政府統(tǒng)計數(shù)據(jù)質(zhì)量問題,該成果從抽樣估計的角度進行研究,給出一系列模型輔助抽樣估計方法,在不增加調(diào)查經(jīng)費的情況下提高估計精度和調(diào)查數(shù)據(jù)質(zhì)量,為前沿的模型輔助抽樣估計方法在我國政府統(tǒng)計部門的應(yīng)用鋪平道路。