1.资料的类型
(1)定量资料(计量资料):表现为数值大小,一般有度量衡单位。如:身高(cm)、体重(kg)、血红蛋白(g/L)等
(2)定性资料(分类资料)
1)无序分类资料
①二项分类:如HIV感染情况,阳性、阴性。
②多项分类:如人类的ABO血型,A型、B型、AB型与O型。
2)有序分类资料:如测定某人群某血清学反应,结果可分“-”、“±”、“+”、“++”4级。
2.定量资料的假设检验方法:t检验、Z检验、卡方检验等,等级资料:秩和检验等级相关等。
3.习惯上将P≤0.05的事件,称为小概率事件,表示在一次抽样的实验或观察中该事件发生的可能性很小,可视为不发生。
4.频数表和频数分布图的主要用途是:
(1)揭示频数分布的特征:集中趋势和离散趋势。
(2)揭示频数分布的类型。
(3)便于发现极大或极小的可疑值。
集中位置指标 |
适用资料类型 |
算术平均数(均数) |
正态分布或近似正态分布资料 |
几何均数 |
血清抗体滴度资料 |
中位数 |
偏态分布、一端或两端无确切值或分布不明确资料 |
6.均数、中位数和几何均数间存在一定的关系:
对于正态分布资料,中位数等于均数;
对于对数正态分布资料,中位数等于几何均数;
对于正偏态分布资料,中位数小于均数;
对于负偏态分布资料,中位数大于均数。
7.描述离散程度(变异程度)的指标
极差、四分位数间距、方差、标准差及变异系数,极差、四分位数间距和标准差都有单位,且与观察值的原始单位相同。
离散程度指标 |
适用资料类型 |
方差、标准差 |
正态分布或近似正态分布资料 |
变异系数 |
计量单位不同或均数相差悬殊的多组资料间变异程度的比较 |
四分位数间距 |
偏态分布、一端或两端无确切值或分布不明确资料 |
10.标准正态分布的均数为0,标准差为1。
11.医学参考值范围的制定
14.t检验的应用条件:
①要求样本来自正态分布总体;
②两样本均数比较时,还要求两样本所属总体的方差相等(即方差齐性)。
15.Ⅰ型错误和Ⅱ型错误
20.四格表资料的卡方检验的自由度是1。
21.行×列表资料的卡方检验的自由度是ν=(行数-1)(列数-1)
22.配对设计差值的符号秩和检验
编秩时,若差值为0,舍去不计,样本含量n相应减去1;若差值绝对值相等,当符号不同时,求平均秩次;当符号相同时,既可顺次编秩,也可求平均秩次。
23.完全随机设计两样本比较的秩和检验
编秩:将两组数据混合由小到大统一编秩。编秩时,遇相同数值在同一组内,可顺次编秩;当相同数值出现在不同组时,则必须求平均秩次。
24.完全随机设计多个样本比较的秩和检验
将各组数据统一按由小到大的顺序编秩,如遇相同数值在同一组内,可顺次编秩;当相同数值出现在不同组时,则必须求平均秩次。
25.回归系数b的含义:自变量x改变一个单位时,应变量y平均改变b个单位。
回归系数b>0时,表示回归直线从左下方走向右上方,即y随x增大而增大;
b<0时,表示回归直线从左上方走向右下方,即y随x增大而减小;
b=0时,表示回归直线平行于x轴,即y与x无线性依存关系。
26.直线相关是指两个随机变量之间呈直线趋势的关系。
r没有单位,取值范围为-1≤r≤+1。
两变量相关的方向用r的正负号表示,即r>0表示正相关;r<0表示负相关。
相关系数r的绝对值大小表示相关的密切程度
︱r︱越接近1,表示两变量间相关关系密切程度越高。
︱r︱=1表示完全相关,r=0表示无直线相关关系,称零相关。
27.直线回归与相关的区别和联系
区别
(1)应用不同:直线回归用于说明两变量间数量依存变化的关系,描述y如何依赖于x而变化;直线相关用于说明两变量间的直线相关关系,此时两变量的关系是平等的。
(2)资料要求不同:直线回归要求应变量y是来自正态总体的随机变量,而x可以是来自正态总体的随机变量,也可以是严密控制、精确测量的变量;相关分析则要求x,y是来自双变量正态分布总体的随机变量。
(3)b和r的含义不同:b表示x每改变一个单位,y平均增(减)b个单位;r说明具有直线关系的两个变量间相关的密切程度与相关方向。
相关推荐: