type
Post
status
Published
date
Apr 8, 2026
slug
applied-statistics
summary
应用统计学笔记(?)
tags
应用统计学
category
学习笔记
icon
password
By BarryZed
统计总体:在某个问题中的研究对象的全体集合
研究全校学生身高
- 总体:全校所有学生
- 个体:每一个学生
数据类型:
- 定类数据:只能分类(最基本测度)
- 定序数据:能排序,但不确定间隔
- 定距数据:无绝对零点 温度
- 定比数据:有绝对零点 身高
抽样方法:
- 系统抽样:等间隔 每k个抽1个
- 分层抽样:先按特征分组,再抽样
- 简单随机抽样:纯随机,全平等
误差缩小倍,样本容量扩大
- 整群抽样:把总体分成多个群,随机选群,群里全要 抽班级
- 非概率抽样:实现方便 找路人
集合数据:多个个体汇总,分组后的
平均数据也属于集合数据
身高(原始):170 172 168 186 175
集合数据:
- 160-170:2人
- 170-180:3人
大样本:样本容量≥30
数据类型:
- 加减无意义的数字仍为字符型数据 手机号 身份证号
- 截面数据:同一时间 + 不同个体 本月学生成绩
- 时间序列数据:同一对象 + 不同时间 某公司2025-2026年的收入
- 面板数据:多个对象 + 多个时间 多个城市的多年GDP
变量:
- 绝对变量/总体变量:总体 总收入
- 相对变量:比率 增长率
- 平均变量:平均 人均GDP
- 定性变量:分类 性别
- 分类变量
- 顺序变量:有顺序,不能加减 等级 满意度
- 集合统计变量:已分好的
- 时期变量:一段时间内的累计结果,一般可加 一个月的销售额 产量
- 时点变量:某一时刻的状态,一般不可加 仓库某天存货量
- 统计变量:强调现实特征,依赖现实数据 市民工资
- 数学变量:抽象符号,不依赖数据 随机变量 服从正态分布
统计方法:
- 描述统计方法:只对现有数据进行总结,不推断
- 推断统计方法:用样本估计总体,预测或做出结论
数据来源:
- 直接数据来源:第一手数据 问卷 实地调查
- 间接数据来源:他人数据 政府统计 数据 年报
统计变量 = 变量 + 多个对象 + 有变化
学生成绩是统计变量,一个人的年龄不是统计变量
各变量值与其算术平均数的离差平方之和等与最小值
全距就是极差
权数对算术平均数的影响取决于权数的相对量。
因为全乘相同系数是上下分子分母约掉,保持不变。
加权算术平均数:
加权算术平均数是“按权数加权”的,权数越大,对结果的影响越大。
几何平均数:
增长率 比例变化
调和平均数:
速率 效率
统计分组的核心问题是选择分组标志。
均值在中位数的哪边,就是哪偏分布
所有数据到中位数的绝对距离总和最小
所有数据到平均数的平方距离总和最小
离散系数 = 标准差 ÷ 平均数 x 100%
非准确数据/频数表求中位数与众数:
中位数:
- :中位数组下限
- :样本量
- :中位数组前累计
- :中位数组频数
- :组距
众数:
- :众数组下限
- :众数组频数
- :前一组频数 (没有 → 取0)
- :后一组频数
- :组距
- 作者:BarryZed
- 链接:
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。






.jpg?table=block&id=2cb05109-5451-8092-a42a-ffaf40797495&t=2cb05109-5451-8092-a42a-ffaf40797495)

