二十三、统计数据的整理与显示
1、品质数据的整理与显示:对品质数据主要是做分类整理,对数值型数据主要是做分组整理。
☆分类数据的整理与显示
在整理分类数据时,除了要列出所分的类别外,还要计算出每一类别的频数、频率或比例、百分比,同时选择适当的图形进行显示。
①分类数据的整理
类别 | 解 释 |
1)频数与频数分布 | 频数:也称次数,是落在各类别中的数据个数。 |
频数分布:也称次数分布,把各个类别及其相应的频数全部列出来就是频数分布或称次数分布。将频数分布用表格的形式表现出来就是频数分布表。 | |
2)比例 | 比例,是一个总体中各个部分的数量占总体数量的比重,通常用于反映总体的构成或结构。各部分的比例之和等于l。 |
3)百分比 | 将比例乘以l00就是百分比或百分数,它是将对比的基数抽象化为100而计算出来的,用%表示。当分子的数值很小而分母的数值很大时,也可以用千分数(‰)来表示比例。 |
4)比率 | 各不同类别的数量的比值。它是一个总体中各不同部分的数量对比。 比率的比值可能大于l。为方便起见,比率可以不用1作为基数,而用100或其他便于理解的数作为基数。 如经济学中的积累与消费之比,国内生产总值中第一、二、三产业产值之比等等。 掌握比例与比率的区别:1)比例—部分与总体的关系;2)比率——部分与部分的关系。 |
②分类数据的图示——条形图和圆形图。
类型 | 描 述 | 例 图 |
条形图 | 用宽度相同的条形的高度或长短来表示数据变动的图形。可以横置或纵置,纵置时也称为柱形图 | 教材182页图23-l |
圆形图 | 也称饼图,是用圆形及圆内扇形的面积来表示数值大小的图形。对于研究结构性问题十分有用。 | 教材182页图23-2 |
☆顺序数据的整理与显示
①累积频数和累积百分比
1)累积频数:就是将各类别的频数逐级累加起来。其方法有两种:向上累积和向下累积。
通过累积频数,可以很容易看出某一类别(或数值)以下及某一类别(或数值)以上的频数之和。
2)累积百分比:就是将各类别的百分比逐级累加起来,也有向上累积和向下累积两种方法。
②顺序数据的图示——累积分布图
根据累积频数或累积频率,可以绘制累积分布图。
2、数值型数据的整理与显示
①数据的分组:分组的方法
分类方法 | 定义 | 适用范围 |
单 变量值分组 | 把每一个变量值作为一组 | 通常只适合于离散变量且变量值较少的情况。 |
组距分组 | 将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 | 连续变量或变量值较多的情况 |
采用组距分组的步骤:
第一步,确定分组组数
确定分组组数的要求是:1)划分的组数,既不应太多也不应太少;2)组数的确定,要尽量保证组间资料的差异性与组内资料的同质性;3)采用的分组办法,要能够充分显示客观现象本身存在的状态。
关于统计分组组数问题,斯特基给出的计算公式为:(了解即可)
第二步,对原始资料进行排序;
第三步,求极差,将最大的观察值与最小的观察值相减便得到极差;
第四步,确定各组组距。在实行等距分组的情况下,组距的确定办法为:
最好把组距取成接近于能被5除尽的一个数。掌握:组距与组数成反比关系,组数越多,组距越小,组数越少,组距越大。
组距是每组观察值的最大差,即每组的上限值与下限值之间的差。
组距=某组的上限值-该组的下限值
第五步,确定组限
组限是组与组之间的界限,或者说是每组观察值变化的范围。组限有上限与下限之分;上限与下限的差值称为组距;上限值与下限值的平均数称为组中值。
确定组限时应注意:1)第一组的下限值应比最小的观察值小一点,最后一组的上限值应比最大的观察值大一点;2)特别需要或不得已的情况除外,最好不要使用开口组;3)组限应取得美观些,按数字偏好,组限值应能被5除尽,且一般要用整数表示。
第六步,确定各组观察值出现的频数
凡观察值落在某一区间的,就计发生一次,最后统计各组观察值发生的总次数。采用组距分组时,需要遵循“不重不漏”的原则。
为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的观察值不算在本组内,而计算在下一组内。
第七步,制作频数分布表,并填上相关的内容,以及其他需要说明的事项。
☆数值型数据的图示——直方图、折线图
①直方图——直方图是用矩形的宽度和高度来表示频数分布的图形。
在直方图中,我们实际上用矩形的面积表示各组的频数分布。
直方图与条形图的区别:1)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,因此其高度与宽度均有意义;2)直方图的各矩形通常是连续排列,而条形图则是分开排列。
②折线图:也称频数多边形图,它是在直方图的基础上,把直方图顶部的中点(即组中值)用直线连接起来,再把原来的直方图抹掉就是折线图。
数据的整理与显示总结
数据类型 | 数据的整理 | 数据的显示 |
分类数据 | 频数、比例、比率、百分比 | 条形图、圆形图 |
顺序数据 | 频数、比例、比率、百分比、累积频数、累积百分比 | 条形图、圆形图、累积分布图 |
数值型数据 | 频数、比例、比率、百分比、累积频数、累积百分比、分组(单变量分组、组距分组) | 条形图、圆形图、累积分布图、直方图、折线图 |
3、统计表
①统计表的构成:统计表是用于显示统计数据的基本工具
统计表构成:一般由表头、行标题、列标题和数字资料四个主要部分组,必要时可以在统计表的下方加上表外附加。
1)表头应放在表的上方,它所说明的是统计表的主要内容。
2)行标题和列标题通常安排在统计表的第一列和第一行,它所表示的主要是所研究问题的类别名称和指标名称,通常也被称为“类”。
3)表外附加通常放在统计表的下方,主要包括资料来源、指标的注释、必要的说明等内容。
②统计表的设计
设计统计表时要注意以下几点:
1.合理安排统计表的结构。比如行标题、列标题、数字资料的位置应安排合理。
2.表头一般应包括表号、总标题和表中数据的单位等内容。
总标题应简明确切地概括出统计表的内容,一般需要表明统计数据的时间、地点以及何种数据,即标题内容应满足3W(统计数据的时间、地点、何种数据的简称)要求。如果表中的全部数据都是同一计量单位,可放在表的右上角标明,若各指标的计量单位不同,则应放在每个指标后或单列出一列标明。
3.表中的上下两条横线一般用粗线,中间的其他线要用细线。
通常情况下,统计表的左右两边不封口,列标题之间一般用竖线隔开,而行标题之间通常不必用横线隔开。表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。对于没有数字的表格单元,一般用“一”表示,一张填好的统计表不应出现空白单元格。
4.在使用统计表时,必要时可在表的下方加上注释,特别要注意注明资料来源,以表示对他人劳动成果和知识产权的尊重。
相关推荐:
在线课程 |
2024年
学考双赢定制班 63%学员选择 |
2024年
学考双赢黑卡班 31%学员选择 |
2024年
学考双赢取证班 6%学员选择 |
2024年
专项提分班 |
||
学 | 基础学习 拿分阶段 |
私教精讲班 | ||||
强化学习 提分阶段 |
重要考点提炼班 | |||||
练 | 冲刺密训 抢分阶段 |
8套名师密押卷 | ||||
背 | 考前终极 抢分阶段 |
通关必备200题 | ||||
考前3小时密训班 | ||||||
专项班 | 经济基础: 图形/计算题专项 |
|||||
专业课: 案例专项专项 |
||||||
★★★ 三星题库 ¥680/年 |
每日一练 |
|||||
每日错题榜 |
||||||
章节刷题 |
||||||
★★★★ 四星题库 ¥980/年 |
真题题库 |
|||||
高频常考 |
||||||
大数据易错 |
||||||
★★★★★ 五星题库 ¥1680/年 |
通关必备200题 |
|||||
名师密押8套卷 |
||||||
教学资料 | 课程讲义 | |||||
全程学习计划书 | ||||||
人工助学服务 | 微信一对一 班主任督学 7×13陪伴模式 |
|||||
老师微信 一对一答疑 |
||||||
定制服务 无忧从容包 |
无忧从容卡 ¥980 | |||||
专项突破班 ¥1360 | ||||||
黑卡特权 | 不过退费 | |||||
额外赠送 | 赠送2023年 【教材精讲班】 |
赠送2023年 【教材精讲班】 |
赠送2023年 【教材精讲班】 |
|||
课程有效期 | 2024年11月30日 | 2025年11月30日 | 2024年11月30日 | 2024年11月30日 | ||
套餐价格 | 全科:¥4680 单科:¥2880 |
全科:¥9880 单科:¥5980 |
全科:¥1580 单科:¥880 |
全科:¥1080 单科:¥680 |