第六节 资料的整理与分析
一、基本整理模式:根据统计分析的要求,队列研究的资料一般整理成下表的模式。
二、人时的计算:常用的人时单位是人年,常用有:
1、以个人为单位计算暴露人年(精确法) 如样本不太大时,可用此法计算。
2、近似法计算暴露人年:不知道每个队列成员进入与退出的具体时间或样本太大时用该法。即平均人数乘以观察年数得到总人年数,平均人数一般取相邻两年的年初人口的平均数或年中人口数。
3、寿命表法:观察对象人数较多,难以用精确法计算暴露人年,但又要求有一定的精度时用此法。
三、率的计算
(一)常用指标:
1、累积发病率(cumulative incidence):用观察开始时的人口数作分母,以整个观察期内的发病(或死亡)人数为分子,变化范围为0~1,其流行病学意义有赖于对累积时间长度的说明。
2、发病密度(incidence density):有各种失访及每个对象被观察的时间不一样等使资料不整齐。此时需以观察人时为分母计算发病率,用人时为单位计算出来的率带有瞬时频率性质称为发病密度。最常用的人时单位是人年,以此求出人年发病(死亡)率。发病密度的量值变化范围是从0到无穷大。
3、标化比:当研究对象数目较少,结局事件的发生率比较低时,是以全人口发病(死亡)率做为标准,算出该观察人群的理论发病(死亡)人数,即预期发病(死亡)人数,再求观察人群中实际发病(死亡)人数与此预期发病人数之比,即得标化发病(死亡)比。
最常用的指标为标化死亡比(standardized mortality ratio, SMR),标化比实际上不是率,而是以全人口的发病(死亡)率做为对照组而计算出来的比。
例如某厂30-40岁组工人有500名,某年内有2人死于肺癌,已知该年全人口30-40岁组肺癌的死亡率2‰,求其SMR。已知O=2,E=500×2‰=1 SMR=2/1=2:即某厂30-40岁年龄组工人死于肺癌的危险达到相应一般人群的2倍。
如果某单位的历年人口资料不能得到,而仅有死亡人数、原因、日期和年龄,则可改算标化比例死亡比(standardized proportional mortality ratio, SPMR)。是以全人口中某病因死亡占全部死亡之比例乘以某单位实际全部死亡数而得出某病因的预期死亡数,然后计算实际死亡数与预期死亡数之比。
例如某厂某年30-40岁年龄组工人死亡总数为100人,其中因肺癌死亡5人,全人口中该年30-40岁组肺癌死亡占全死因死亡的比例为2.2%,则SPMR=5/(100*2.2%)=2.27。即某厂30-40岁年龄组肺癌死亡的危险为一般人群的2.27倍。
(二)显著性检验:队列研究为抽样研究,发现两组率有差别时,要考虑抽样误差的可能,进行统计学显著性检验。
1、U检验:当研究样本量较大,p和1-p都不太小,如np和n(1-p)均大于5时,样本率的频数分布近似正态分布,此时可应用正态分布的原理来检验率的差异是否有显著性,即用U检验法来检验暴露组与对照组之间率的差异。
P1为暴露组的率,P0为对照组的率,n1为暴露组观察人数,n0为对照组的观察人数,Pc为合并样本率,其中X1和X0分别为暴露组和对照组结局事件的发生数。求出u值后,查u界值表得P值,按所取的检验水准即可作出判断。
2. 其他检验方法:如果率比较低,样本较小时,可改用直接概率法、二项分布检验或泊松(Poisson)分布检验;率差的显著性检验可以利用的四格表资料的卡方检验;对SMR或SPMR的检验,实际是所得结果值偏离1的检验,其检验方法可用X2检验或计分检验(score test)。
四、效应的估计:
队列研究的最大优点就在于它可以直接计算出研究对象的结局的发生率,能直接计算出暴露组与对照组之间的率比和率差,即相对危险度RR(relative risk)与归因危险度A(attributable risk),从而可直接准确地评价暴露的效应。
1、相对危险度(RR)也叫危险比(risk ratio)或率比(rate ratio),是反映暴露与发病(死亡)关联强度的最有用的指标,式中Ie和Io分别代表暴露组和非暴露组的率。
RR表明暴露组发病或死亡的危险是非暴露组的多少倍。RR值越大,表明暴露的效应越大,暴露与结局关联的强度越大。RR算出的只是一个点估计值,是一个样本值。若要估计数值的总体范围,应考虑到抽样误差的存在,需计算其可信区间,通常用95%可信区间。常用的有Woolf法和Miettinen法。如Woolf法。lnRR的95%可信区间=其反自然对数即为RR的95%可信区间。
2. 归因危险度(AR) 又叫特异危险度、率差(rate difference, RD)和超额危险度(excess risk),是暴露组发病率与对照组发病率相差的绝对值,它表示危险特异地归因于暴露因素的程度。
RR说明暴露者与非暴露者比较增加相应疾病危险的倍数;AR则一般是对人群而言,暴露人群与非暴露人群比较,所增加的疾病发生数量,如果暴露因素消除,就可减少这个数量的疾病发生。前者具有病因学的意义,后者更具有疾病预防和公共卫生学上的意义。以表4-9,从RR看,吸烟对肺癌的作用较大,病因联系较强;从AR看,吸烟对心血管疾病的作用较大,预防所取得的社会效果将更大。
3. 归因危险度百分比(AR%):又称为病因分值EF(etiologic fraction),是指暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比。
4、人群归因危险度(population attributable risk,PAR)与人群归因危险度百分比(PAR%) 人群归因危险度百分比也叫人群病因分值(population etiologic fraction, PEF)。
PAR是指总人群发病率中归因于暴露的部分,而PAR%是指PAR占总人群全部发病(或死亡)的百分比。RR和AR都说明暴露的生物学效应,即暴露的致病作用有多大;而PAR和PAR%则说明暴露对一个具体人群的危害程度,以及消除这个因素后可能使发病率或死亡率减少的程度,它既与RR和AR有关,又与人群中暴露者的比例有关。
5. 剂量反应关系的分析:如果某种暴露存在剂量效应关系,即暴露的剂量越大,其效应越大,则该种暴露作为病因的可能性就增大。其分析方法是先列出不同暴露水平下的发病率,然后以最低暴露水平组为对照,计算各暴露水平的相对危险度和率差。必要时,应对率的变化作率的趋势性检验。
相关推荐: