(四)抽样中的误差问题
进行抽样调查可产生两类误差,一类是抽样误差,另一类是非抽样误差。
1.抽样误差
■抽样误差是指严格按照随机原则抽样时,所得样本统计值与总体参数值之差,主要指样本平均数与总体平均数之差、样本比率与总体比率之差。
■抽样平均误差,是指所有可能出现的样本统计值的标准差。
通常运用最多的抽样平均误差是指样本平均数或样本比率的标准差。
在重复抽样条件下,运用得最多的计算抽样平均误差公式是简单随机抽样的平均误差公式。它又可以分为:
(1)样本平均数的抽样平均误差公式,即: ,式中ux为样本平均数的抽样平均误差,σ为总体标准差,n为样本个案数;
(2)样本比率的抽样平均误差公式: ,式中up为样本比率的抽样平均误差,P为总体比率,n为样本个案数。上述两个公式中的总体标准差σ与总体比率P都是未知的,因此实际计算时,则以样本标准差代替总体标准差,以样本比率代替总体比率。
对于不重复抽样,在总体个案数很大时,而样本个案数相对很小的情况下,一般都采用重复抽样的平均误差公式来代替。
虽然抽样误差不可避免,但可以减小,其措施有:(1)增加样本个案数;(2)适当选择抽样方式。例如,在同样条件下,不重复抽样比重复抽样的抽样误差小,又如在总体现象分类比较明显时,采用分层随机抽样比其他方法的抽样误差小。
2.非抽样误差
非抽样误差是指除抽样误差之外,由其他原因引起的样本统计量与总体真值之间的差异。导致非抽样误差的原因主要有:
(1)抽样框误差,是指因不准确或不完整的抽样框而引起的误差,如丢失目标总体单位(例如北京市女性消费习惯,采用电话调查,则排除了那些没有电话的女性)、包含非目标单位、复合连接(例如银行对储户进行调查,则在该银行有多个账户的顾客容易被抽中)、不正确的辅助信息和抽样框老化等;
(2)无应答误差,主要表现为低的答复率、不具代表性的样本;
(3)应答误差,主要表现为力图给出一个愉悦调查人员的答复、错误的记忆、疲劳或弄错了问题的性质、对主题缺乏了解、力图给出社会认同的答复、受到访问人员的影响等,这些误差都可能导致应答误差。
(五)样本容量的确定
样本容量又称“样本数”。它指一个样本的必要抽样单位数目。
1.直觉。即根据直觉来确定样本包含多少个样本单元。这种方法通常是在非概率抽样中应用。
2.统计精度。概率抽样的样本容量是在计算的基础上确定的,即在其他条件已定情况下,样本容量的确定主要取决于满足估计精确度的要求。样本量的基本公式为:n=Z2σ2/d2(式中:n为样本量,Z为置信区间,d为抽样误差范围,σ为标准差,一般取0.5)。
3.成本限制。根据分配给项目的经费来决定样本容量。
4.行业经验数值。行业经验数值指的是那些根据经验得到的数据。在运用非概率抽样方法,如定额抽样时,利用行业经验数值是非常有效率的。
相关链接:在线课程 |
2024年
学考双赢定制班 63%学员选择 |
2024年
学考双赢黑卡班 31%学员选择 |
2024年
学考双赢取证班 6%学员选择 |
2024年
专项提分班 |
||
学 | 基础学习 拿分阶段 |
私教精讲班 | ||||
强化学习 提分阶段 |
重要考点提炼班 | |||||
练 | 冲刺密训 抢分阶段 |
8套名师密押卷 | ||||
背 | 考前终极 抢分阶段 |
通关必备200题 | ||||
考前3小时密训班 | ||||||
专项班 | 经济基础: 图形/计算题专项 |
|||||
专业课: 案例专项专项 |
||||||
★★★ 三星题库 ¥680/年 |
每日一练 |
|||||
每日错题榜 |
||||||
章节刷题 |
||||||
★★★★ 四星题库 ¥980/年 |
真题题库 |
|||||
高频常考 |
||||||
大数据易错 |
||||||
★★★★★ 五星题库 ¥1680/年 |
通关必备200题 |
|||||
名师密押8套卷 |
||||||
教学资料 | 课程讲义 | |||||
全程学习计划书 | ||||||
人工助学服务 | 微信一对一 班主任督学 7×13陪伴模式 |
|||||
老师微信 一对一答疑 |
||||||
定制服务 无忧从容包 |
无忧从容卡 ¥980 | |||||
专项突破班 ¥1360 | ||||||
黑卡特权 | 不过退费 | |||||
额外赠送 | 赠送2023年 【教材精讲班】 |
赠送2023年 【教材精讲班】 |
赠送2023年 【教材精讲班】 |
|||
课程有效期 | 2024年11月30日 | 2025年11月30日 | 2024年11月30日 | 2024年11月30日 | ||
套餐价格 | 全科:¥4680 单科:¥2880 |
全科:¥9880 单科:¥5980 |
全科:¥1580 单科:¥880 |
全科:¥1080 单科:¥680 |