社会统计学课件.ppt
《社会统计学课件.ppt》由会员分享,可在线阅读,更多相关《社会统计学课件.ppt(149页珍藏版)》请在三一办公上搜索。
1、社会统计学Social Statistics,1,感谢你的观看,2019年8月23,绪论 单变量的描述统计分析 两个类别变量关系的描述统计 两个尺度变量关系的描述统计 类别变量与尺度变量关系的描述统计 概率与随机变量的概率分布 大数定律、中心极限定理与抽样分布 参数估计 假设检验的基本原理 总体均值与方差的假设检验 两个类别变量关系的假设检验 两个尺度变量关系的假设检验 类别变量与尺度变量关系的假设检验 非参数检验 抽样 时间序列,目录,2,感谢你的观看,2019年8月23,W.J.Conover著,崔恒建译,实用非参数统计(第三版),人民邮电出版社,2006年4月。卢淑华,社会统计学(第三版
2、),北京大学出版社,2005年5月。戴维.K.希尔德布兰德、加德曼.R.爱沃森、约翰.H.奥尔德里奇等著,社会统计方法与技术,社会科学文献出版社,2005年6月。浙江大学数学系高等数学教研组编,概率论与数理统计,人民教育出版社1979年3月尹海洁、刘耳著,社会统计软件SPSS15.0 for Windows 简明教程,2008年12月。何书元,概率论与数理统计,高等教育出版社,2006年6月。贾俊平 何晓群 金勇进编著,统计学(第五版),中国人民大学出版社,2012年6月。同济大学概率统计教研组编著,概率统计(第二版),同济大学出版社,2000年5月。易丹辉编著,时间序列分析:方法与应用,中国
3、人民大学出版社,2011年3月。美James D.Hamilton著,刘明志译,时间序列分析,中国社会科学出版社,1999年。中国统计年鉴,参考文献,3,感谢你的观看,2019年8月23,第一章绪论,社会学研究的过程及统计学的应用,统计分析方法在社会学研究中的作用,抽样方法与统计分析方法的选择,变量的层次及统计分析方法的选择,本章习题,4,感谢你的观看,2019年8月23,第一章 绪论第一节 社会学研究的过程及统计学的应用,研究结束,5,感谢你的观看,2019年8月23,第一章 绪论第二节 统计分析方法在社会学研究中的作用,一、统计分析方法应用水平是社会学研究科学性的重要标志保尔拉法格在忆马克
4、思中谈到,马克思认为:“一种科学只有在成功地运用数学时,才算达到了真正完善的地步。”二、统计分析方法应用的目的是要发现和描述社会现象的统计规律(一)社会调查资料的特点1、随机性客观现象可分为确定性现象和非确定性现象(随机现象)2、统计规律性:通过对大量个体特征的统计分析来描述和分析社会现象的统计规律。(二)统计学是发现和彰显统计规律的有效工具三、统计学在社会学研究中的地位,6,感谢你的观看,2019年8月23,第一章 绪论第三节 抽样方法与统计分析方法的选择,社会调查从研究的范围来分类可以分为全面调查与非全面调查,抽样调查是非全面调查的重要方式。一、总体、个体与样本(一)总体(populati
5、on)与个体(case)总体是研究对象的全体。个体也称个案,是构成总体的最小单位,是具体调查分析对象。(二)样本(Sample)是从总体中抽出的用于实施调查研究的对象集合。二、抽样方法与统计分析方法的选择应用随机原则获得的样本称为随机样本,否则是非随机样本。社会统计学的内容可分为两大部分:描述统计与推论统计。全面调查,只使用描述统计即可。应用推论统计的必要前提是样本必须是随机样本。,7,感谢你的观看,2019年8月23,第一章 绪论第四节 变量的层次及统计分析方法的选择,一、变量的层次按照变量的取值特征和统计分析时方法应用的特征,变量的层次可以划分为类别变量和尺度变量等两大类。(一)类别变量1
6、、无序类别变量(Nominal Variable)也称为定类变量,是测量层次最低的变量。如职业、家庭类型、婚姻状况、专业、人际关系类型、地区类别等等。2、有序类别变量(Ordinal Variable)也称为定序变量或序列变量。如职称、职务级别、学生的年级等等。如用1、2、3、4、5、6、7分别表示文盲、小学、初中、高中、大专、大学、研究生。,8,感谢你的观看,2019年8月23,第一章 绪论第四节 变量的层次及统计分析方法的选择,(二)尺度变量(Scale Variable)若测量工具有单位,则测量结果就不仅能够比较大小,而且能够比较出大多少或小多少。此种测量就是尺度测量,得到的变量就是尺度
7、变量。尺度变量根据测量工具是否具有绝对零分为定距变量和定比变量。1、定距变量无绝对零,若存在零,则这个零是个相对零。如使用摄氏温度计测量的温度便是定距变量。2、定比变量定比测量是最高层次的测量,它不仅有相等的单位可以比较被测事物间的数量差异。而且有了绝对0,这样就可以对被测事物间的倍数进行比较。在社会学研究中,常用的有年龄、收入、住房面积等等属于定比变量。,9,感谢你的观看,2019年8月23,第一章 绪论第四节 变量的层次及统计分析方法的选择,(三)不同层次变量的功能及转换由于对某一事物进行测量时可以使用不同层次的测量工具,因此对同一事物进行测量可能出现多种测量结果。设计问卷时,要尽可能多地
8、设计测量层次高的变量。,10,感谢你的观看,2019年8月23,第一章 绪论第四节 变量的层次及统计分析方法的选择,二、变量层次与统计分析方法的选择(一)不同层次单变量统计分析方法的选择对于类别变量,可以使用频次分布表、条形图、圆形图、线形图等来描述变量的分布状态;可以用众数和异众比率描述其集中趋势和离散趋势。对于有序类别变量,还可以用中位数和四分位差或全距描述其集中趋势和离散趋势。对于尺度变量,可以使用频次分布表、直方图、线形图等来描述变量的分布状态,用算术平均数和方差或标准差描述变量的集中趋势和离散趋势。(二)不同层次两个变量关系的统计分析方法的选择分析两个变量间的关系:明确两个变量是否有
9、关系。如果有关系,相关的强度如何?相关的方向怎样等等。两个变量的测量层次不同,应用的统计分析方法也不同。,11,感谢你的观看,2019年8月23,第一章 绪论本章习题,1-1 结合社会学研究的过程谈谈统计学在其中所起的作用是什么?1-2 社会调查资料具有哪些特点?1-3 解释总体、个体、样本这几个概念。1-4 变量可以分为哪些类型?1-5 类别变量与尺度变量的区别是什么?1-6 简要陈述不同层次变量的功能。1-7 举例说明统计学在社会学研究中的应用。,12,感谢你的观看,2019年8月23,第二章单变量的描述统计分析,单变量的分布及其描述方法,集中趋势,离散趋势,本章习题,13,感谢你的观看,
10、2019年8月23,第二章 单变量的描述统计分析第一节 单变量的分布及其描述方法,单变量的描述统计就是用统计表、统计图和统计特征值将变量的状态、水平和分布特征表现出来的方法。一、变量及其分布(一)变量的特征 1、变量的含义:研究对象的每个个体都具有很多属性和特征。比如每个人都有身高、体重、年龄、学历等特征。这些在不同个体上具有不同表现的特征就称为变量。统计学中的变量在个体上是相对稳定的,在不同个体上表现出变化。这类变量也称为随机变量。2、变量取值的两个特征完备性。完备性是指变量的取值必须涵盖全部的个案。互斥性。互斥性是指变量的取值之间不能互相包容。,14,感谢你的观看,2019年8月23,第二
11、章 单变量的描述统计分析第一节 单变量的分布及其描述方法,一、变量及其分布(二)变量的分布变量分布指个体在变量取值上的分布。对一组观察值,一般用频次分布、频率分布和累积频率分布三种方法描述变量分布。1、频次分布:变量取值与取值上拥有的个体数的集合称为频次分布。若变量有m个取值,则该变量的频次分布可表示为:,例如:调查1000户家庭,7种家庭类型户数的频次分布为:(核心家庭,707户)(直系家庭,182户)(大家庭,7户)(断代家庭,9户)(单亲家庭,37户)(单身家庭,15户),15,感谢你的观看,2019年8月23,第二章 单变量的描述统计分析第一节 单变量的分布及其描述方法,一、变量及其分
12、布(二)变量的分布2、频率分布:变量取值与取值上拥有的个体数的频率的集合称为频率分布。将频率分布的频率乘以100%,即是百分比。频率分布可以表示为:,例如:调查1000户家庭,7种家庭类型户数的频率分布为:(核心家庭,0.707)(直系家庭,0.182)(大家庭,0.007)(断代家庭,0.009)(单亲家庭,0.037)(单身家庭,0.015)(其它家庭,0.043),16,感谢你的观看,2019年8月23,第二章 单变量的描述统计分析第一节 单变量的分布及其描述方法,一、变量及其分布(二)变量的分布3、累计频率分布:将上述频率分布中的频率按变量的取值排列顺序逐项累加就形成累积频率分布。分布
13、可以表示为:,例如:调查1000户家庭,7种家庭类型户数的累计频率分布为:(核心家庭,0.707)(直系家庭,0.889)(大家庭,0.896)(断代家庭,0.905)(单亲家庭,0.942)(单身家庭,0.957)(其它家庭,1),17,感谢你的观看,2019年8月23,第二章 单变量的描述统计分析第一节 单变量的分布及其描述方法,一、变量及其分布(二)变量的分布关于频次分布、频率分布和累计频率分布的总结可以清楚地表现数据的分布特征和统计规律,但只适用于类别变量。例如文化程度、职业、职称等。对取值很多的尺度变量,通常将变量的取值划分成段,如年龄段、收入段,再累计该段中的人数,来表示变量的分布
14、。尺度变量取值的数据有两种:离散性数据,如年龄。通常取整数,在相邻的两个数之间不存在其它的数据。连续性数据,如身高。如果测量的单位可以达到无穷小的话,理论上,任何两个数之间都有无穷多个数。尺度变量的分布在统计表中予以详细说明。,18,感谢你的观看,2019年8月23,第二章 单变量的描述统计分析第一节 单变量的分布及其描述方法,二、统计表 表现数据分布的最常用方法是统计表。将数据按照一定的顺序排列在由横行、纵列交叉结合而成的表格上。(一)统计表的结构 统计表可分为横表与竖表,应用较多的是竖表(教材表2-1)。,表号,标题,表头,表身,主词,宾词,19,感谢你的观看,2019年8月23,第二章
15、单变量的描述统计分析第一节 单变量的分布及其描述方法,(二)描述类别变量分布特征的统计表简单表 简单表:主词按变量的取值一一列出,适用于表现类别变量的分布。主词是类别变量的取值,宾词是各个取值出现的频次、频率或百分比及累计频率或累计百分比等。(教材表2-2)。,(1)表的正上方须有标题,简明、扼要、准确地说明表的内容。(2)表的左上方应有表的编号。(3)数字部分横行间不必标划线条,两侧不画纵线,呈开口式。(4)数字书写要工整,小数点上下对位。(5)当某项数字缺少时用“”表示。(6)如有对表的其它说明可在表的下面写出表注。,制作原则,20,感谢你的观看,2019年8月23,第二章 单变量的描述统
16、计分析第一节 单变量的分布及其描述方法,二、统计表(三)描述尺度变量分布特征的统计表分组表 1、分组表的特点:尺度变量取值很多,可以采用分组表来表现尺度变量的分布特征。分组表的主词是将变量的取值按一定的标准分组或分段的统计表。主词中每个组的最大值称为组上限,最小值称为组下限。(教材表2-3),21,感谢你的观看,2019年8月23,第二章 单变量的描述统计分析第一节 单变量的分布及其描述方法,二、统计表(三)描述尺度变量分布特征的统计表分组表 1、分组表的制作步骤:(1)确定全距。全距就是变量观察值的最大值与最小值之差。(2)确定组距与组数。一般是2、3、5、10或它们的倍数。(3)确定各组的
17、上下限。最低组的下限要小于最小的观察值,最高组的上限要大于最大的观察值。连续型数据的一组的下限与下一组的上限为同一值,习惯上以组的上限为实,下限为虚。(即“下组限不包括在内”的原则)(4)登记各组中个案的频次,计算频率。将个案按照变量取值大小划分到各组中,按需要统计出频次、频率及累计频率等,并将统计出的数据置于相应单元格内,绘制成分组表。,22,感谢你的观看,2019年8月23,二、统计表(三)描述尺度变量分布特征的统计表分组表 1、分组表的制作步骤:确定全距;确定组距与组数;确定各组的上下限。;登记各组中个案的频次,计算频率。,23,感谢你的观看,2019年8月23,第二章 单变量的描述统计
18、分析第一节 单变量的分布及其描述方法,二、统计图 统计图就是用图的形式来表示变量的分布特征。比统计表更直观、生动、易记忆,缺点是不如统计表精确。变量的测量层次不同,使用的图形也不尽相同。不同类型的图形表示数据大小的方式不同。用图形表现数据的分布特征时有一定的规范和要求。每个图的左下方都要有图的编号,图的正下方要有图的名称,用以简明扼要地说明图的内容。如有其它的说明可以在图的下面写出图注。如果图中有多种绘图元素,可以用图例的形式予以说明。,24,感谢你的观看,2019年8月23,第二章 单变量的描述统计分析第一节 单变量的分布及其描述方法,二、统计图(一)描述类别变量分布特征的统计图1、简单条形
19、图:条形的长短或高低来表示数据大小。以类别变量的取值为横轴的分类标志,以纵轴表示频次或频率。(教材图2-1),25,感谢你的观看,2019年8月23,二、统计图(一)描述类别变量分布特征的统计图2、圆形图:也称饼图。一般用于描述类别变量中各类别所占的比例。是以一个圆为整体,以每一部分所占的比例来分割圆心角,圆心角所对应的扇形即表示每一部分所占的比例。,第二章 单变量的描述统计分析第一节 单变量的分布及其描述方法,26,感谢你的观看,2019年8月23,二、统计图(一)描述类别变量分布特征的统计图3、线形图:线形图是在坐标系内用折线或连续曲线表示事物的分布或变化的图。,第二章 单变量的描述统计分
20、析第一节 单变量的分布及其描述方法,图2-3 2000年全国家庭户主受教育程度分布,27,感谢你的观看,2019年8月23,二、统计图(二)描述尺度变量分布特征的统计图1、直方图:描述尺度变量分布,用条形长短或高低来表现数据大小。与简单条形图不同的是,条的宽度表示分组的组距,条与条之间不分离。直方图以尺度变量为横轴,以分组的组限为横轴的数据标志,以纵轴表示频次或频率。分组表的数据就可以用直方图来表示。用表2-4的频率分布数据制作的直方图如图2-4所示。,第二章 单变量的描述统计分析第一节 单变量的分布及其描述方法,28,感谢你的观看,2019年8月23,图2-4 住房使用面积分布直方图,简单条
21、形图用于描述类别变量的分布,直方图用于描述尺度变量的分布,29,感谢你的观看,2019年8月23,直方图的典型应用是人口金字塔。是一种横的直方图,纵轴是以5岁为组距的分段的年龄,横轴是人数。由男性年龄分布和女性年龄分布两个直方图合并而成。图2-5是中国2008年的人口金字塔。,图2-5 2008年中国人口金字塔资料来源:根据中国人口与就业统计年鉴2009 相关数据绘制,30,感谢你的观看,2019年8月23,二、统计图(二)描述尺度变量分布特征的统计图2、累积频率直方图:以尺度变量为横轴,以分组的组限为横轴的数据标志,以纵轴表示累积频率,制作的直方图就是累积频率直方图。用表2-4的累积频率分布
22、数据制作的累积频率直方图如图2-6所示。,图2-6 住房使用面积累积频率直方图,31,感谢你的观看,2019年8月23,二、统计图(二)描述尺度变量分布特征的统计图3、线形图:将直方图或累计频率直方图每条顶部的中点用直线连接即构成描述尺度变量分布的线形图。,图2-8 住房使用面积累积频率线形图,图2-7 住房使用面积分布线形图,32,感谢你的观看,2019年8月23,(二)描述尺度变量分布特征的统计图4、点状分布图:直方图虽能较好表现尺度变量的分布特征。但它通过分组将尺度变量转化成了顺序变量,组内数据值无法表现。若数据量足够大,可用点状分布图来详细地表现变量的分布特征。点状分布图以尺度变量为横
23、轴,用点的累积表现变量取值上的个体数。,图2-9 居民住房使用面积的点状分布图,33,感谢你的观看,2019年8月23,第二章 单变量的描述统计分析第二节 集中趋势,用图和表的形式虽然能够很好地表现变量的分布状况,但是不够简洁,尤其是将不同的总体或样本进行比较时,使用表或图难以得出清晰的结论。很多情况下,我们不需要对所有的数据都有详尽的了解。在对不同总体进行比较时,也不可能一一地使用每一个数据,这就需要对变量的全部取值进行概括,找出一个典型的统计特征值来代表全体数据。集中趋势(和离散趋势)就是概括地说明变量的状态或水平的统计特征值。由于测量层次不同,变量取值的数据特征不同,用于概括变量状态的集
24、中趋势也不同。常用的集中趋势统计量:众数;中位数;算数平均数。常用的离散趋势统计量:异众比率;极差(全距);四分位差;方差与标准差。,34,感谢你的观看,2019年8月23,第二章 单变量的描述统计分析第二节 集中趋势,一、众数M0众数(mode)根据频次来确定的集中趋势量值。在一个变量的取值中,出现频次最多的变量值就是众数。表2-1中,“初中”是我国家庭户主文化程度的众数。,35,感谢你的观看,2019年8月23,第二章 单变量的描述统计分析第二节 集中趋势,一、众数M0关于众数的几点注意事项(1)众数适用于任何层次的变量,只要是知道了频次分布就可以找到众数。但主要用于概括和描述类别变量。(
25、2)对于分组的尺度变量,出现频次最高的组称为众数组,可以用众数组的组中值(组上限和组下限的平均值)近似地代替众数。分组数据的众数可以精确计算(可进一步参见李金昌、苏为华,统计学,机械工业出版社,2007年2月出版,72页)。但计算出来的众数只是理论众数,并非实际上取值最多的数据。)(3)众数较适用于单峰分布的情况。多峰分布的众数可能不唯一,所以通常不使用众数来概括变量分布的状态。,36,感谢你的观看,2019年8月23,第二章 单变量的描述统计分析第二节 集中趋势,二、中位数Md中位数(median)是位于数列中点的数值,它恰好把全部数据分为两半,比它大的数据个数与比它小的数据个数正好相等。因
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会 统计学 课件

链接地址:https://www.31ppt.com/p-3343684.html