第三节 描述离散趋势的统计指标
同一总体中不同个体存在的差异称为变异。为比较全面地把握资料的分布特征,不仅需要了解数据的集中位置,而且需要了解数据的离散程度。常用的描述离散趋势的统计量包括极差、四分位数间距、方差、标准差和变异系数。
一、极 差
意义:极差,也称全距。样本量接近的同类资料比较,极差越大意味着数据间变异越大。极差只考虑数据的最大值和最小值,所以用极差反映数据的变异程度常常比较粗略和不稳定。
计算:R=最大值—最小值
适用条件:资料不限。
二、四分位数间距
意义:四分位数间距表示百分位数和百分位数之差,理论上与之间恰好包括总体中间50%的个体观察值。同类资料比较,Q越大意味着数据间变异越大。用四分位数间距反映数据的变异程度比极差稳定。
适用条件:四分位数间距可用于各种分布资料,特别对偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。
三、方 差
意义:方差考虑了全部观察值的变异程度。总体方差用表示,定义为观察值离均差平方和的算术均数;样本方差用表示,是总体方差的无偏估计。同类资料比较时,方差越大意味着数据间变异度越大。
计算:
适用条件:见标准差。
四、标 准 差
意义:方差的算术平方根称为标准差。总体标准差用表示,样本标准差用S表示。标准差的量纲与原变量一致,故实际应用中常使用标准差。同类资料比较时,标准差越大意味着观察值间变异度越大。
计算:
其中,n-1称为自由度。
适用条件:方差和标准差都适用于对称分布的资料,特别对正态分布或近似正态分布资料,常把均数和标准差结合起来,全面描述的集中趋势和离散趋势。
五、变 异 系 数
意义:变异系数用CV表示,为标准差与算术均数之比,是一个不带量纲的相对数。
适用条件:方差和标准差都适用于对称分布的资料,特别对正态分布或近似正态分布资料,常把均数和标准差结合起来,全面描述资料的集中趋势和离散趋势。
第四节 描述分布形态的统计指标
一、偏度系数
意义:理论上总体偏度系数为0时,分布是对称的;取正值时,分布为正偏峰;取负值时分布为负偏峰。
二、峰度系数
意义:理论上正态分布的总体峰度系数为0;取负值时,其分布较正态分布的峰平阔取正值时,其分布较正态分布的峰尖峭。
相关推荐: