第四节 数据分析
一、基础统计分析
(一)描述统计分析
1.集中趋势的测度
集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势就是确定数据一般水平的代表值或中心值。集中趋势的测量有三个常用的指标:
(1)众数,是一组数据中出现次数最多的变量值。
对数据确定众数时,只需把数据整理后列出频数(出现次数)分布表,频数最多的那一组为众数。从分布图形来看,众数应对应于图形最高点。有些情况下数据分布可能表现为双众数,甚至多众数,也有另一种情况,即没有众数(均匀分布)。众数的基本思想,是用来反映一组数据若存在聚中趋势,则在数据的中心,变量值出现的频数较高,众数就是这一位置的代表值。
众数的一个突出特点是它不受极端数值的影响。
(2)中位数,是一组数据排序后处于中间位置的变量值,是一组数据的中点,即高于和低于它的数据各占一半。
(3)均值,是集中趋势的主要测度值,用于反映一组数值型数据的一般水平。主要包括算术平均数、调和平均数和几何平均数。
2.离散程度的测度
数据的离散程度是数据分布的另一重要特征,它是指各变量值远离其中心值的程度,所以也叫离中趋势。
离中趋势是经过综合与抽象后对数据一般水平的概括性描述,它对数据的代表性取决于数据的离散程度,离散程度小代表性就好,反之代表性就差。
(1)极差,也称全距,是一组数据中最大值与最小值之差。
极差是描述数据离散程度的最简单的方法,表明数据的分布范围。它计算简单,易于理解。但是极差由两端数值所决定,不能反映中间数据的分布离散状况。
(2)平均差,也叫平均离差,是各变量值(Xi)与其均值()离差绝对值的平均数:
平均差反映了所有数据与均值的平均距离。平均差越小,说明数据离散程度越小。
(3)方差和标准差。方差是一组数据中各变量值与均值离差平方的平均数。方差的平方根叫标准差。方差与标准差是描述数据分布特征的重要的统计量,它们是反映数值型数据离散程度最主要、最常用的方法。
根据总体数据和样本数据计算方差及标准差时,计算公式略有不同。
式中Xi是数值序列中的单个数值, 是这组数值的平均值,N是总体数值的个数,n是样本数值的个数。
计算样本方差与标准差时之所以与总体不同,是因为计算样本方差或标准差时,是要把它作为总体方差或标准差的估计量,统计上对估计量要求满足一些条件(一致性、无偏性、有效性),为满足无偏性条件,样本方差计算时,分母要用n-1,而不是n。
3.相关分析
所谓相关分析,是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。
变量之间的相关关系主要有线性相关和非线性相关、正相关和负相关等几种形式。
对两个变量间线性相关程度的测量称为简单相关系数。样本相关系数定义公式为:
式中,r为样本相关系数,COVXY为协方差,Sx、Sy分别是变量x和y的标准差。(注意:公式中分子分母求和表达式中应该是i=1到n,而不是n=1到n)
相关系数r的取值范围在-1~+1之间。
·r=1或r=-1时,表明变量间的关系为完全正相关或完全负相关,这是两种极端的情况,实际上表明两个变量之间是线性关系;
·r=0时,表明变量间不存在线性相关关系,可能是无相关,也可能是非线性相关;
·0 ·-l |r|愈接近于l,变量间相关程度愈高,|r|愈接近于0,相关程度愈低。 在一般情况下,总体相关系数p是未知的,一般是用样本相关系数r作为总体相关系数P的估计值。但由于存在样本抽样的随机性,样本相关系数并不直接反映总体相关程度,因而,计算出来的样本相关系数在多大程度上值得信赖,需要进行检验。 |r|<自由度(df)为(n-2)的t统计量t(n-2)、显著性为a(10%;5%)的相关系数(查相关系数表),其相关性是显著的。所谓“显著水平”或r=0,指的是很少会发生的概率。 (教材这句话是错误的,正确的表达为: |r|>时,相关性是显著的。
其中 ,而则可以通过查表得知,α可以取5%,也可以取10%)
在实际中,因为研究目的、变量类型的不同,采用的相关分析也不同。比较常用的相关分析有二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析和距离分析等。
在线课程 |
2024年
学考双赢定制班 63%学员选择 |
2024年
学考双赢黑卡班 31%学员选择 |
2024年
学考双赢取证班 6%学员选择 |
2024年
专项提分班 |
||
学 | 基础学习 拿分阶段 |
私教精讲班 | ||||
强化学习 提分阶段 |
重要考点提炼班 | |||||
练 | 冲刺密训 抢分阶段 |
8套名师密押卷 | ||||
背 | 考前终极 抢分阶段 |
通关必备200题 | ||||
考前3小时密训班 | ||||||
专项班 | 经济基础: 图形/计算题专项 |
|||||
专业课: 案例专项专项 |
||||||
★★★ 三星题库 ¥680/年 |
每日一练 |
|||||
每日错题榜 |
||||||
章节刷题 |
||||||
★★★★ 四星题库 ¥980/年 |
真题题库 |
|||||
高频常考 |
||||||
大数据易错 |
||||||
★★★★★ 五星题库 ¥1680/年 |
通关必备200题 |
|||||
名师密押8套卷 |
||||||
教学资料 | 课程讲义 | |||||
全程学习计划书 | ||||||
人工助学服务 | 微信一对一 班主任督学 7×13陪伴模式 |
|||||
老师微信 一对一答疑 |
||||||
定制服务 无忧从容包 |
无忧从容卡 ¥980 | |||||
专项突破班 ¥1360 | ||||||
黑卡特权 | 不过退费 | |||||
额外赠送 | 赠送2023年 【教材精讲班】 |
赠送2023年 【教材精讲班】 |
赠送2023年 【教材精讲班】 |
|||
课程有效期 | 2024年11月30日 | 2025年11月30日 | 2024年11月30日 | 2024年11月30日 | ||
套餐价格 | 全科:¥4680 单科:¥2880 |
全科:¥9880 单科:¥5980 |
全科:¥1580 单科:¥880 |
全科:¥1080 单科:¥680 |