Lazy loaded image
学习笔记
📈应用统计学
字数 1023阅读时长 3 分钟
2026-4-8
2026-4-9
type
Post
status
Published
date
Apr 8, 2026
slug
applied-statistics
summary
应用统计学笔记(?)
tags
应用统计学
category
学习笔记
icon
password
By BarryZed
统计总体:在某个问题中的研究对象的全体集合
研究全校学生身高
  • 总体:全校所有学生
  • 个体:每一个学生
数据类型
  • 定类数据:只能分类(最基本测度)
  • 定序数据:能排序,但不确定间隔
  • 定距数据:无绝对零点 温度
  • 定比数据:有绝对零点 身高
抽样方法
  • 系统抽样:等间隔 每k个抽1个
  • 分层抽样:先按特征分组,再抽样
  • 简单随机抽样:纯随机,全平等
    • 误差缩小倍,样本容量扩大
  • 整群抽样:把总体分成多个群,随机选群,群里全要 抽班级
  • 非概率抽样:实现方便 找路人
集合数据:多个个体汇总,分组后的
平均数据也属于集合数据
身高(原始):170 172 168 186 175
集合数据:
  • 160-170:2人
  • 170-180:3人
大样本:样本容量≥30
数据类型
  • 加减无意义的数字仍为字符型数据 手机号 身份证号
  • 截面数据:同一时间 + 不同个体 本月学生成绩
  • 时间序列数据:同一对象 + 不同时间 某公司2025-2026年的收入
  • 面板数据:多个对象 + 多个时间 多个城市的多年GDP
变量
  • 绝对变量/总体变量:总体 总收入
  • 相对变量:比率 增长率
  • 平均变量:平均 人均GDP
  • 定性变量:分类 性别
  • 分类变量
    • 顺序变量:有顺序,不能加减 等级 满意度
  • 集合统计变量:已分好的
 
  • 时期变量:一段时间内的累计结果,一般可加 一个月的销售额 产量
  • 时点变量:某一时刻的状态,一般不可加 仓库某天存货量
 
  • 统计变量:强调现实特征,依赖现实数据 市民工资
  • 数学变量:抽象符号,不依赖数据 随机变量 服从正态分布
统计方法
  • 描述统计方法:只对现有数据进行总结,不推断
  • 推断统计方法:用样本估计总体,预测或做出结论
数据来源
  • 直接数据来源:第一手数据 问卷 实地调查
  • 间接数据来源:他人数据 政府统计 数据 年报
统计变量 = 变量 + 多个对象 + 有变化
学生成绩是统计变量,一个人的年龄不是统计变量
各变量值与其算术平均数的离差平方之和等与最小值
全距就是极差
权数对算术平均数的影响取决于权数的相对量。
因为全乘相同系数是上下分子分母约掉,保持不变。
加权算术平均数
加权算术平均数是“按权数加权”的,权数越大,对结果的影响越大。
几何平均数
增长率 比例变化
调和平均数
速率 效率
统计分组的核心问题是选择分组标志
均值在中位数的哪边,就是哪偏分布
所有数据到中位数的绝对距离总和最小
所有数据到平均数的平方距离总和最小
离散系数 = 标准差 ÷ 平均数 x 100%
非准确数据/频数表求中位数与众数:
中位数:
  • :中位数组下限
  • :样本量
  • :中位数组前累计
  • :中位数组频数
  • :组距
众数:
  • :众数组下限
  • :众数组频数
  • :前一组频数 (没有 → 取0)
  • :后一组频数
  • :组距
上一篇
算法设计与分析
下一篇
概率论与数理统计
  • 作者:BarryZed
  • 链接:
  • 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。

评论
Loading...