第二章 定量资料的统计描述
【重点难点】
第一节 频率分布表与频率分布图
一、离散型定量变量的频率分布
对离散型定量变量,变量值的取值是不连续的。直接清点各变量值出现的频数,即为频率分布表。离散型定量变量的频率分布图可用直方图表达,以各等宽矩形直条的高度表示各频率的多少。
二、连续型定量变量的频率分布
对连续型定量变量,变量值的取值是连续的,将数据适当分组,清点各组的频数,即为频率分布表。连续型定量变量的频率分布图可用直方图表达。即纵坐标为频率密度,即频率/组距,直方图的面积之和等于1.
三、频率分布表(图)的用途
频率分布表(图)可以揭示资料的分布类型,如对称分布或偏峰分布;也可以描述资料的分布特征,即集中趋势和离散趋势;便于发现某些特大和特小的可疑值;便于进一步计算指标和统计分析。
第二节 描述集中趋势的统计指标
对于连续型定量变量,平均数是应用最广泛、最重要的一个指标体系,它常用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。常用的平均数有3种:算数均数、几何均数和中位数。
一、算术均数
意义:算术均数简称均数,常用μ表示总体均数,表示样本均数。反映全部数量观察值的平均数量水平。
适用条件:适用于对称分布资料,尤其正态或近似正态分布资料。
计算:1.直接法(基于原始数据)
2. 频率表法(也叫加权法,基于频率表资料)
二、几何均数
意义:几何均数以符号G表示,常用来反映一组含多个数量级数据的集中位置。
适用条件:适用于原始观察值分布不对称,但经对数转换后呈对称分布的资料,如对数正态分布资料。观察值间常呈倍数关系,或变化范围跨越多个数量级。
计算:1.直接法(基于原始数据)
2.频率表法(也称加权法,基于频率表资料)
三、中位数
意义:中位数常用符号M表示,是指将原始观察值从小到大排序后,位次居中的那个数,即理论上有一半的观察值低于中位数,一般都观察值高于中位数。
适用条件:中位数适用于各种分布的资料,特别是偏峰分布资料、分布末端无确定值的资料等。
计算:1.直接法(基于原始数据)
将n例观察值从小到大排列。
n为奇数时,则选择第(n+1)/2个为中位数
n为偶数时,则中位数是第(n/2)个数和第[(n/2)+1]个数的平均值
2.百分位数法(基于频率表资料)
四、众 数
意义:全部实测值中出现次数最多的数值即为众数。
相关推荐: