如何衡量数据的离散程度.docx
《如何衡量数据的离散程度.docx》由会员分享,可在线阅读,更多相关《如何衡量数据的离散程度.docx(3页珍藏版)》请在三一办公上搜索。
1、如何衡量数据的离散程度如何衡量数据的离散程度 我们通常使用均值、中位数、众数等统计量来反映数据的集中趋势,但这些统计量无法完全反应数据的特征,即使均值相等的数据集也存在无限种分布的可能,所以需要结合数据的离散程度。常用的可以反映数据离散程度的统计量如下: 极差 极差也叫全距,指数据集中的最大值与最小值之差: 极差计算比较简单,能从一定程度上反映的数据集的离散情况,但因为最大值和最小值都取的是极端,而没有考虑中间其他数据项,因此往往会受异常点的影响不能真实反映数据的离散情况。 四分位距 我们通常使用箱形图来表现一个数据集的分布特征: 一般中间矩形箱的上下两边分别为数据集的上四分位数和下四分位数,
2、中间的横线代表数据集的中位数,四分位距是使用Q3减去Q1计算得到: 如果将数据集升序排列,即处于数据集3/4位置的数值减去1/4位置的数值。四分位距规避了数据集中存在异常大或者异常小的数值影响极差对离散程度的判断,但四分位距还是单纯的两个数值相减,并没有考虑其他数值的情况,所以也无法比较完整地表现数据集的整体离散情况。 方差 方差使用均值作为参照系,考虑了数据集中所有数值相对均值的偏离情况,并使用平方的方式进行求和取平均,避免正负数的相互抵消: 方差是最常用的衡量数据离散情况的统计量。 标准差 方差得到的数值偏差均值取平方后的算术平均数,为了能够得到一个跟数据集中的数值同样数量级的统计量,于是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 如何 衡量 数据 离散 程度
链接地址:https://www.31ppt.com/p-3412370.html