第四节 数据分析
一、基础统计分析
(一)描述统计分析
1.集中趋势的测度
集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势就是确定数据一般水平的代表值或中心值。集中趋势的测量有三个常用的指标:
(1)众数,是一组数据中出现次数最多的变量值。
对数据确定众数时,只需把数据整理后列出频数(出现次数)分布表,频数最多的那一组为众数。从分布图形来看,众数应对应于图形最高点。有些情况下数据分布可能表现为双众数,甚至多众数,也有另一种情况,即没有众数(均匀分布)。众数的基本思想,是用来反映一组数据若存在聚中趋势,则在数据的中心,变量值出现的频数较高,众数就是这一位置的代表值。
众数的一个突出特点是它不受极端数值的影响。
(2)中位数,是一组数据排序后处于中间位置的变量值,是一组数据的中点,即高于和低于它的数据各占一半。
(3)均值,是集中趋势的主要测度值,用于反映一组数值型数据的一般水平。主要包括算术平均数、调和平均数和几何平均数。
例子:十名学生的成绩
100 |
80 |
95 |
87 |
99 |
79 |
80 |
95 |
92 |
95 |
众数:95(出现3次) 中位数:
79 |
80 |
80 |
87 |
92 |
95 |
95 |
95 |
99 |
100 |
(92+95)÷2=93.5(如果数据是奇数个,则中位数就是中间那个数据)
平均数:
(79+80+80+87+92+95+95+95+99+100)/10=90.2
2.离散程度的测度
数据的离散程度是数据分布的另一重要特征,它是指各变量值远离其中心值的程度,所以也叫离中趋势。
离中趋势是经过综合与抽象后对数据一般水平的概括性描述,它对数据的代表性取决于数据的离散程度,离散程度小代表性就好,反之代表性就差。
(1)极差,也称全距,是一组数据中最大值与最小值之差。
极差是描述数据离散程度的最简单的方法,表明数据的分布范围。它计算简单,易于理解。但是极差由两端数值所决定,不能反映中间数据的分布离散状况。
(2)平均差,也叫平均离差,是各变量值(Xi)与其均值( )离差绝对值的平均数:
平均差反映了所有数据与均值的平均距离。平均差越小,说明数据离散程度越小。
(3)方差和标准差。方差是一组数据中各变量值与均值离差平方的平均数。方差的平方根叫标准差。方差与标准差是描述数据分布特征的重要的统计量,它们是反映数值型数据离散程度最主要、最常用的方法。
在线课程 |
2024年
学考双赢定制班 63%学员选择 |
2024年
学考双赢黑卡班 31%学员选择 |
2024年
学考双赢取证班 6%学员选择 |
2024年
专项提分班 |
||
学 | 基础学习 拿分阶段 |
私教精讲班 | ||||
强化学习 提分阶段 |
重要考点提炼班 | |||||
练 | 冲刺密训 抢分阶段 |
8套名师密押卷 | ||||
背 | 考前终极 抢分阶段 |
通关必备200题 | ||||
考前3小时密训班 | ||||||
专项班 | 经济基础: 图形/计算题专项 |
|||||
专业课: 案例专项专项 |
||||||
★★★ 三星题库 ¥680/年 |
每日一练 |
|||||
每日错题榜 |
||||||
章节刷题 |
||||||
★★★★ 四星题库 ¥980/年 |
真题题库 |
|||||
高频常考 |
||||||
大数据易错 |
||||||
★★★★★ 五星题库 ¥1680/年 |
通关必备200题 |
|||||
名师密押8套卷 |
||||||
教学资料 | 课程讲义 | |||||
全程学习计划书 | ||||||
人工助学服务 | 微信一对一 班主任督学 7×13陪伴模式 |
|||||
老师微信 一对一答疑 |
||||||
定制服务 无忧从容包 |
无忧从容卡 ¥980 | |||||
专项突破班 ¥1360 | ||||||
黑卡特权 | 不过退费 | |||||
额外赠送 | 赠送2023年 【教材精讲班】 |
赠送2023年 【教材精讲班】 |
赠送2023年 【教材精讲班】 |
|||
课程有效期 | 2024年11月30日 | 2025年11月30日 | 2024年11月30日 | 2024年11月30日 | ||
套餐价格 | 全科:¥4680 单科:¥2880 |
全科:¥9880 单科:¥5980 |
全科:¥1580 单科:¥880 |
全科:¥1080 单科:¥680 |