简介
固定效应模型和随机效应模型是社会科学研究中的常用模型。在社会科学研究者在使用回归模型进行分析时,有可能存在这样一种情况,即每个案例在不同时点上的残差都存在一定的相关和相互依赖,这通常是因为不同案例在某些未被观察到的特征上存在差异,这就违背了误差项相互独立的假设,而固定效应模型和随机效应模型都是用来解决残差相关的问题。二者均可用在从非实验数据中进行有效的效果推论中。但固定效应模型更适合被用来控制那些无法被测量的变量。本书介绍了固定效应模型的基本原理、Logistic回归方法,并对计数变量的固定效应模型和事件史数据的固定效应模型进行了介绍。在本书的*后,作者介绍了固定效应结构方程模型,并以将相关软件的应用指令列举在附录中。
目录
第1章 导言
第2章 线性固定效应模型:基本原理
第1节 两期数据(固定效应分析)
第2节 两期数据差分法的扩展
第3节 每个个体被观察三期及以上的一阶差分方法
第4节 每个个体被观察两期及以上的虚拟变量法
第5节 在固定效应法中设置与时间的交互作用
第6节 与随机效应模型的比较
第7节 混合(模型)法
第8节 总结
第3章 固定效应Logistic回归
第1节 两期数据
第2节 三期及多期数据(固定效应分析)
第3节 与时间的交互作用
第4节 混合(模型)法
第5节 多分类反应变量的(固定效应)方法
第6节 总结
第4章 计数变量的固定效应模型
第1节 每个个体被观察两期的计数数据泊松模型
第2节 多期数据泊松模型
第3节 计数数据的固定效应负二项模型
第4节 混合(模型)法
第5节 总结
第5章 事件史数据的固定效应模型
第1节 Cox回归
第2节 带固定效应的Cox回归
第3节 附加说明
第4节 Cox回归混合模型法
第5节 非重复事件的固定效应事件史法
第6节 总结
第6章 固定效应结构方程模型
第1节 随机效应作为潜变量的模型
第2节 固定效应作为潜变量的模型
第3节 固定效应和随机效应的折中
第4节 带滞后自变量的交互效应
第5节 总结
附录1 第2章到第5章例题的Stata程序
附录2 第6章例题的Mplus程序
注释
参考文献
译名对照表
【书摘与插画】
我们对调查数据的考虑重点关注满足两个基本要求的样本设计。首先,我们只关心概率抽样(probability sampling),其中总体里面的每个成员均有已知的不等于零的概率被选中在样本里面。这是对某个给定的设计把统计理论应用到调查估计量的特性的推导中的基础。其次,如果某个样本要从某个总体中被抽取出来,就有必要建立一个罗列了合适的抽样单位(sampling units)的抽样框(sampling frame),且这些抽样单位必须涵盖总体中的所有成员。如果罗列所有总体成员是不可行或不现实的,那么某些总体成员的集群(clusters)也可用作抽样单位。比如,建立一个包括美国所有家庭的清单是不切实际的,但是我们可以在几个不同的阶段选择样本。在*个阶段,随机选取县(counties);在第二个阶段,在每个被选中的县内抽取普查区(census tracts);在第三个阶段,在每个被选中的普查区内选取街区(street blocks)。然后在*后的选择阶段,只需要对被选中的街区罗列家庭(households)清单即可。这个多阶段设计保证了所有总体成员都具有已知的且不等于零的被选中概率(nonzero probability of being selected)。
抽样方法的种类
*简单的抽样设计是简单随机抽样(simple random sampling),它要求总体中的每个成员具有相同的被包括在样本里面的概率,且罗列了所有总体成员的清单是可以获得的。样本成员的选择可以通过有放回或无放回两种方式进行。简单有放回随机抽样(SRSWR)特别让人感兴趣,因为它通过放回处理排除了被选中的成员间的相关性(协方差covariance),因而简化了统计推断(statistical inference)。但在这个方案中,一个成员可能在样本中出现多于一次。在实际中,简单随机抽样是通过无放回的方式进行的(简单无放回随机抽样SRSWOR),因为没有必要不止一次地从同一个成员中搜集信息。此外,SRSWOR相比SRSWR给出的抽样方差更小。但是,对于只从总体成员中选取一小部分的大型调查来说,这两种方法实际上是一样的。我们将在本书中使用SRS一词表示SRSWOR,除非另有说明。
SRS设计被进一步调整以适应其他理论或实际的考虑。常用的实际设计方案包括系统抽样(systematic sampling)、分层随机抽样(stratified random sampling)、多阶段集群抽样(multistage cluster sampling)、PPS抽样(按规模大小成比例概率抽样probability proportional to size)和其他受控制的选择程序。这些更实际的设计在两个重要方面偏离SRS。首先,总体成员被选中的概率(以及由个体成员组成的不同集群的联合被选中概率[joint inclusion probabilities])可能并不相同。其次,抽样单位可能不同于我们感兴趣的总体成员。这些偏离使常用的估计方法和方差计算方法复杂化,而且如果没有使用恰当的分析方法,可能会导致估计和统计检验的偏差。我们将用几个具体的抽样设计详细考虑这些偏离情况,并检验它们对调查分析的影响。
系统抽样(systematic sampling)是替代SRS的一种很常用的办法,因为它的简单性。它在一个随机起始点(在1和k之间)之后,选择每个处于第k个位置的成员。其程序上的任务很简单,而且我们很容易对该程序进行检查,但是要通过检验结果来核实SRS却很困难。它常用于多阶段抽样的*后一个阶段,如当实际调查者被指示要从某个街区的住宅清单中选择预定比例的(住宅)单位时。系统抽样程序对总体中的每个成员指定相同的被选中的概率,这确保当总体中的成员数量(N)等于样本中成员数量(n)的k倍时,样本均值(sample mean)将是总体均值(population mean)的无偏估计(unbiased estimate)。如果N并不严格等于nk,就无法确保相同的概率,虽然这个问题在N很大时可以被忽略。在这种情况下,我们可以使用循环系统抽样方案(circular systematic sampling scheme)。在这个方案中,随机起始点是在1至N之间选择的(任何成员都可以成为起始点),然后假定这个抽样框是循环的(列表的末端与列表的开头是相连的),选择每个处于第k个位置的成员。但是,当抽样框中的成员是以与调查变量相关的循环方式罗列,且抽样间距正好与清单的循环周期相吻合时,系统抽样就可能导致不真实的估计。比如,如果我们对到某个诊所的每隔40个病人选取1个,而平均每天的病人流量几乎就是40,那么得到的系统抽样将只包括那些在一天中的某个特定时间到该诊所的人。这样的样本可能无法代表这个诊所的所有病人。
光盘服务联系方式: 020-38250260 客服QQ:4006604884
云图客服:
用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问