数据录入与样本描述.ppt
《数据录入与样本描述.ppt》由会员分享,可在线阅读,更多相关《数据录入与样本描述.ppt(54页珍藏版)》请在三一办公上搜索。
1、第二讲,数据录入及样本描述,本讲主题Session Topic,表格方法Tabular Methods图形方法Graphical Methods数值方法Numerical Methods,表格和图形方法 Tabular and Graphical Methods,质量(定性)数据汇总Summarizing Qualitative Data数量(定量)数据汇总Summarizing Quantitative Data探索性数据分析Exploratory Data Analysis交叉组列表和散点图Cross-tabulation and Scatter Diagrams,质量数据汇总Summar
2、izing Qualitative Data,频数分布 Frequency Distributions相对频数分布 Relative Frequency Distributions百分数频数分布 Percent Frequency Distributions条形图 Bar Graph饼形图 Pie Chart,频数分布 Frequency Distributions,频数分布是用数据概括表的形式不列示若干个互不重叠分组中每组数据值出现的次数;编制频数分布表的目的是揭示表面数据的内涵,而这种数据内涵很难迅速从原始数据中获取。,相对频数分布和百分数频数分布 Relative Frequency D
3、istributions and Percent Frequency Distributions,相对频数是各组数据出现的频数占数据总数的比例;相对频数分布是表明每一组的相对频数的数据集的表格总汇;百分数频数分布是相对频数乘以100;百分数频数分布是表明每一组的百分数频数的数据集的表格总汇。,条形图Bar Graph,条形图是用图的方式描述已概括成频数、相对频数或百分数频数分布的质量数据的方法;在图形的横轴为每一组别的标记;纵轴为频数、相对频数、百分数频数;用固定宽度的条绘制每一标记,扩展条的高度达到纵轴上表示的各组别的频数、相对频数或百分数频数;条形相对独立以强调每一类是一独立的 事实。,饼
4、形图Pie Chart,饼形图也是常用的描绘质量数据相对频数分布的图形方法;先画圆,然后用相对频数把圆划分为扇形。其角度大小与相对频数对应,数量(定量)数据汇总Summarizing Quantitative Data,频数分布 Frequency Distributions相对频数分布 Relative Frequency Distributions百分数频数分布 Percent Frequency Distributions点图 Dot plot直方图 Histogram累积分布 Cumulative Distribution 穹形图 Ogive,频数分布 Frequency Distri
5、butions,确定无重复的组别数一般为为5-20个组大样本数据分较多的组小样本数据分较少的组确定各组间的组距各组间的组距相同近似组距为,近似组距=-,最大数据值-最小数据值,组数,频数分布 Frequency Distributions,确定组上线与组下线下线确定分配给该组可能的最小数据值;上线确定分配给该组可能的最大数据值;上、下线不一定是所给数据值;上、下线的确定不唯一,可依据数据中小数点的位置选取适当的上、下线;上、下线的确定应使得每个数据属且只属于其中一个组。,相对频数和百分数频数Relative Frequency Distributionsand Percent Frequenc
6、y Distributions,相对频数分布和百分数频数分布相对频数是各组数据出现的频数占数据总数的比例;相对频数分布是表明每一组的相对频数的数据集的表格总汇;百分数频数分布是相对频数乘以100;百分数频数分布是表明每一组的百分数频数的数据集的表格总汇。,点图 Dot plot,点图是用图形概括数据最简单的方法之一;点图用横坐标轴显示数据的值域,然后用小圆点半每个数据值标在坐标轴的上方,直方图 Histogram,直方图是将数据所反映的分布直观地显示出来的一种常用方法;横轴为所感兴趣的变量,纵轴为频数、相对频数或百分频数;每一组的频数、相对频数或百分数频数用长方形表示,长方形的底在横轴上,宽是
7、组距,高是相应的频数、相对频数或百分数频数;不像条形图,直方图在邻近的组间没有分隔。,累积分布 Cumulative Distribution,累积频数分布表示小于或等于每一组上限的数据值的个数的取值情况;累积相对频数分布表示小于或等于每一组上限的数据值所点比例的取值情况;累积百分数频数分布就是累积相对频数与100乘积,穹形图 Ogive,穹形图即是累积频数分布或累积相对频数分布的图形;横轴为所感兴趣的变量,纵轴为累积频数或累积相对频数;,探索性数据分析Exploratory Data Analysis,放在后面与数值方法一起讲,交叉分组列表Cross-tabulation,交叉分组列表是一种
8、同时汇总两个变量数据的表格方法一般在表格的左边和顶端的标记定义两个变量的组数交叉分组列表揭示了所列两个变量之间的内在关系,散点图 Scatter Diagrams,散点图是将两个变量之间的关系直观地显示出来的一种方法,数值方法 Numerical Methods,位置的度量 Measures of Location离散程度的度量 Measures of dispersion形状的度量 Measures of Shape,位置的度量 Measures of Location,平均数 Mean中位数 Median众数 Mode百分位数 Percentiles四分位数Quartiles,平均数 Me
9、an,所有数据之和与数据个数的商如果数据集是总体,总体平均值(population mean)为如果数据集为样本,样本平均值(Simple mean)为,中位数 Median,若数据的个数是奇数,当把所有数据按升序排列时,中位数就是处在中心位置的数若数据的个数是偶数,当把所有数据按升序排列时,中位数就是处在中心两个数的平均数,众数 Mode,出现频数最高的数如果有多于一个众数存在,则称数据是多峰的,百分位数 Percentiles,第p个百分位数是这样的数据值:至少有p%个数据值跟它一样或比它小;至少有(100-p)%个数据值跟它一样大或比它大。百分位数的计算:增序排列数据;计算指数 I=(p
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 录入 样本 描述
链接地址:https://www.31ppt.com/p-6296632.html