首页 > 其他 > 详细

深入浅出统计学01

时间:2020-07-15 20:16:49      阅读:62      评论:0      收藏:0      [点我收藏+]

深入浅出统计学

框架

  1. 第一印象
  2. 集中趋势的度量
  3. 分散性与变异度的度量
  4. 概率计算
  5. 离散概率分布的运用
  6. 排列与组合
  7. 几何分布、二项分布及泊松分布
  8. 正态分布的运用
  9. 再谈正态分布的运用
  10. 统计抽样的运用
  11. 总体和样本的估计
  12. 置信区间的构建
  13. 假设检验的运用
  14. x^2分布
  15. 相关与回归

01 第一印象

基本概念

  1. 频数:频数是一种统计方法,用来描述一个类别中有多少个项。
  2. 频数密度:长方形高度用于度量一个特定组的频数的集中程度,是对频数密集度的一种度量,是用于说明数字到底是“稠密”还是“稀薄”的一种方法。长方形的高度称为频数密度。
  3. 累积频数:累加到某个特定数值为止的总频数。即频数的累计总和。通过累计频数可知到该数值点为止的总频数。例如,假设你有一些人的年龄数据。数值27的累积频数表示到27岁(包括27岁在内)为止的人有多少。

图形种类

  1. 饼图
  2. 条形图 - 条形图中的每一个长方形代表一个特定类,长方形的长度代表某种数值。长方形越长,数值越大。所有长方形的宽度都相等。
    1. 垂直条形图
    1. 水平条形图

标度

  1. 百分数标度
  2. 频数标度

处理多批数据

  1. 堆积条形图
  2. 分段条形图

数据的分类

  1. 类别数据(定性数据)
  2. 数据值数据(定量数据)

直方图和条形图的区别

    1. 每个长方形的面积与频数成正比
    1. 图上的长方形之间没有间隔

绘制区间相同的直方图

  • 查看每个区间,求出每个区间的宽度,以及每个区间涵盖的数据范围。同时要确保直方图的各个长方形之间没有间隔。
  • 为了保证各个长方形之间没有间隔,要适当的扩大第一个区间的结束范围,减少第二个区间的开始范围,从而形成一条唯一边界(一般是从中间会合)。扩大和缩小的点,对应的另一个端点也要一起调整从而保证区间范围不变。
  • 比如(0-99)、(200-399)在直方图中要用(-0.5-199.5)、(199.5-399.5)表示。

绘制区间不相等的直方图

  1. 求长方形的宽度 - 长方形所覆盖的数值范围就是长方形的宽度。
  2. 求长方形的高度
    1. 长方形面积 = 每组频数
    1. 长方形高度 = 频数 / 长方形宽度
长方形高度用于度量一个特定组的频数的集中程度,是对频数密集度的一种度量,是用于说明数字到底是“稠密”还是“稀薄”的一种方法。长方形的高度称为频数密度。
  1. 画出直方图
  • 纵坐标为频数密度

累计频数图(折线图)

累积频数:累加到某个特定数值为止的总频数。即频数的累计总和。通过累计频数可知到该数值点为止的总频数。例如,假设你有一些人的年龄数据。数值27的累积频数表示到27岁(包括27岁在内)为止的人有多少。

总结

  • 使用哪种图形归根结底在于你要传递的信息,以及你要提炼的主要事实。

深入浅出统计学01

原文:https://www.cnblogs.com/xiaoheng2020/p/13307025.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!