多目标分层次复合抽样设计的探究(2)

本文在前人研究成果的基础上,尝试对多目标分层次复合抽样设计进行探讨.全文共分为四个部分:第一部分为预备知识,第二部分为多目标分层次复合抽


本文在前人研究成果的基础上,尝试对多目标分层次复合抽样设计进行探讨.全文共分为四个部分:第一部分为预备知识,第二部分为多目标分层次复合抽样的基本理论,第三部分为应用聚类分析法进行层的划分,第四部分以实例的形式将多目标分层抽样与简单随机抽样在同一框架下进行了对比得出了本文的结论,即多目标分层次抽样设计在估计精确性及稳定性的框架下要优于其他抽样方式.多目标抽样相较于单目标抽样的研究来说还不够成熟,本文也难免有不足与偏颇之处.

1 预备知识

1.1 WG Cochran的分层抽样理论

在20世纪50年代以WG Cochran为首的一批学者曾对分层抽样进行过深入的探究,并得到了被广泛使用的结论.具体可表述为:在按比例分层的情况下,即n_h/n=N_h/N或n_h/N_h =n/N或f_h=f时,对总体每个单位的均值进行估计:

y ̅_st=1/N ∑_(h=1)^L▒〖N_h y ̅_h=〗  ∑_(h=1)^L▒〖W_h y ̅_h 〗                    (1.1)                  式中,将h层的单位总数表述为N_h,且∑_(h=1)^L▒〖N_h=N〗;第h层的层权可表述为W_h=N_h/N;将第h层的样本均值表述为y ̅_h=(∑_(i=1)^(n_h)▒y_hi )/N_h ;h层的抽样比为f_h=n_h/N_h .在按比例分配的情况下,y ̅_st的方差为:

  V(y ̅_st)=∑_(h=1)^L▒〖N_h/N  (S_h^2)/n ((N-n)/N)=(1-f)/n ∑_(h=1)^L▒〖W_h S_h^2 〗〗               (1.2)

式中,数值y_hi是从第h层的第i个单位得到的;h层的真实方差为S_h^2=1/(N_h-1) 〖(y_hi-Y ̅_h)〗^2.考虑到便于比较,V_prop为V(y ̅_st)的方差,将简单随机抽样方差记作:

〖 V〗_ran=S^2/n (1-f)                           (1.3)

分层总体方差理论可知:

(N-1)S^2=∑_(h=1)^L▒∑_(i=1)^(n_h)▒〖(y_hi-Y ̅ )^2=∑_h▒∑_i▒〖(y_hi-Y ̅_h )^2+∑_h▒〖N_h (Y ̅_h-Y ̅ )^2 〗〗〗

           =∑_h▒〖(N_h-1) S_h^2+∑_h▒〖N_h (Y ̅_h-Y ̅ )^2 〗〗                      (1.4)

在可以将1/N_h 忽略的情况下,可将1/N项也略去,可得:

           S^2=∑▒〖W_h S_h^2 〗+∑▒〖W_h 〖(Y ̅_h-Y ̅)〗^2 〗                  (1.5)

则,

         V_ran=(1-f)  S^2/n=(1-f)/n ∑▒〖W_h S_h^2+(1-f)/n ∑▒〖W_h 〖(Y ̅_h-Y ̅)〗^2 〗〗

             =V_prop+(1-f)/n ∑▒〖W_h 〖(Y ̅_h-Y ̅)〗^2 〗                           (1.6)

则可得到V_prop≤V_ran.上述结论是在一个指标的环境下得到的,而且为简单不放回抽样,又在与1相较时1/N_h 项也被略去不计.因此此结论的局限性显而易见,即未对多指标和放回抽样的状况作出表述.

1.2 多目标与规模成比例的概率抽样(MPPS)

如果将Poisson抽样技术与永久随机数技术进行联合探究即可得到PPS抽样技术的发展,即MPPS抽样技术.

永久随机数技术、Poisson抽样技术、PPS抽样技术共同构成了MPPS的主体.永久随机数技术是将所有单元赋予均匀分布在(0,1)之间的随机数,且一旦赋值后终身不变,这样随机抽取随机数就相当于随机抽取了样本单元,从而实现了抽样的随机性.Poisson抽样技术是以伯努利实验为基础一种严格不放回、样本量不确定的抽样方法,用π_i表示总体单元的入样概率.以伯努利实验的成功与否作为单元是否入样的判别标准.进行N次伯努利实验,使得样本容量n成为一个随机变量.PPS抽样技术的重点在于入样概率的确定.多主题调查是多变量与规模成比例概率抽样的特点,而不同主题的分布往往也不同,因此较大差异的入样概率往往发生于此.其入样概率的计算具体为: