《传播研究方法》第十四讲.ppt
《《传播研究方法》第十四讲.ppt》由会员分享,可在线阅读,更多相关《《传播研究方法》第十四讲.ppt(81页珍藏版)》请在三一办公上搜索。
1、传播研究方法,第四部分 数据分析第十四讲 假设与推论统计,中国青年政治学院 赵菁 2015年12月17日,复习统计学:是什么?,统计学:两个作用描述性统计:用某种方法对资料进行总结,使之更便于使用。例:回收了200份问卷,如何总结概括资料?【百分数、均值、标准差】当处理两个以上变量的相互关系时,描述性统计特别有用。【相关系数、多元统计分析】归纳性统计(统计推论):根据从总体抽取的样本对总体进行概括;根据反复观察制定普遍性定律。,复习:理解平均数,平均数(average):集中趋势量度(measures of central tendency)均值(mean)中位数(median):一系列数据的
2、中点。众数(mode):出现次数最多的数值。,复习:理解平均数,何时用什么?【众数、中位数、平均数】依赖于所描述的数据类型如果数据属性是分类的,而且数值只属于一种类型,使用众数;如果数据中包含极值,而且不想扭曲平均数(按均值计算),则使用中位数;如果数据不包括极值,也不是分类数据,就使用均值。,复习:理解变异性,变异性(variability):散布/离散程度,对不同数值之间的差异性的测量。每个数值和特定值的差异程度,均值,变异性的三种量度:极差、标准差、方差,四、理解变异性,计算极差(range):数据分布中的最大值减去最小值计算标准差(standard deviation,缩写为s或SD)
3、:标准化了的与均值的偏差,与均值的平均距离计算方差(variance):标准差的平方,复习:用图表说话,频数分布(frequency distribution):记录和展现特定数据出现次数的方法。在建立频数分布时,数值通常依据一定的组距分组。组距(dass interval):一个值域范围,五、用图表说话,建立直方图,建立直方图(Histogram),建立直方图(Histogram),建立直方图(Histogram),频数分布,数据分布相互区别程度的四个方面:平均值变异性偏度峰度(kurtosis),频数分布平均值,数据分布相互区别程度的四个方面:平均值分布E均值分布D均值分布C均值分布B均值
4、分布A均值,分布A均值,分布B均值,分布C均值,分布D均值,分布E均值,频数分布变异性,数据分布相互区别程度的四个方面:变异性均值相同,变异性不同;分布A的变异性分布B的变异性分布C的变异性分布D的变异性分布E的变异性,分布A,分布B,分布C,分布D,分布E,频数分布偏度,数据分布相互区别程度的四个方面:偏度(skewness)正偏(右侧尾比左侧尾长);负偏(左侧尾比右侧尾长)分布A:正偏分布C:负偏分布B:无偏,分布A,分布B,分布C,频数分布峰度,数据分布相互区别程度的四个方面:峰度(kurtosis)扁平Or陡峭分布A:扁平分布C:陡峭分布B:无峰度陡峭峰说明离散性或变异性更小,分布A,
5、分布B,分布C,复习:计算相关系数,相关系数(correlation coefficient):反映两个变量之间关系的量化指标【动态性质】。二元相关:两个变量的相关变量变化方向相同,为正相关(positive correlation);变量变化方向相反,为负相关(negative correlation)皮尔逊积距相关(Pearson Product-momentcorrelation):考察两个连续变量之间的关系相关系数r;rXY:变量X和Y之间的相关系数,复习:计算相关系数,相关系数(correlation coefficient):,!相关关系讨论的是一个群体的两个变量之间的关系,反映的
6、是通则,而不是对应任何一个特定的个人。,观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?,年龄与脂肪的散点图,从整体上看,它们是线性相关的;这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关。,复习:计算相关系数,有关相关系数:相关系数的绝对值反映相关的强度。相关系数-0.7比相关系数0.5表示的相关强度;相关系数反映两个变量共同变化的程度。如果一个变量值不发生变化,那么就不存在共同的变异性,即,两个变量之间的相关系数为0【如,年龄和逻辑推理能力,年龄均为25岁】。如果限制或控制一个变量的值域范围,这个变量和其他变量之间的相关系数相对于这个值没有
7、限制的情况来说会更【如,计算阅读理解成绩与年级之间的相关】。变异性产生影响,不应该人为的限制变异性。,大,小,本讲概要,描述统计:计算信度和效度正态曲线假设:检验你的问题显著性的含义推论统计两个群体的t检验不同群体的均值检验两个群体的t检验两个相关群体的均值检验方差分析(One-way ANOVA),一、利用SPSS计算信度和效度,重复信度/前侧-后测方法(Test-retest method):重复同样的测量处理信度问题。如果预期获得的信息不该有变化,那么重复测量就应该得到相同的结 果。如果两次测量的结果有出入,且差异较大,那么测量方法就一定有问题。复本信度(Parallel-forms R
8、eliability):以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。,计算重复信度:计算皮尔逊相关系数,计算复本信度:计算皮尔逊相关系数,假设研究记忆,看一眼给定的10个单词并尽可能记住,然后在20秒内记忆、10秒钟休息,之后背诵这些单词。建立复本:测试内容相同:符合研究任务要求的另一组单词,不同于第一组。,计算复本信度:计算皮尔逊相关系数,内在一致性信度:克隆巴赫系数,内在一致性(internal consistency reliability):确定测试中的项目是否彼此一致,都只表示一个维度、一个结构或一个关注的领域。,4+4=?5-?=36
9、+2=?8-?=31+1=?,4+4=?这三只小猪中哪一只最肥?6+2=?8-?=3这匹狼到底要干什么?,较高的内在一致性,内在一致性信度:克隆巴赫系数,内在一致性(internal consistency reliability):确定测试中的项目是否彼此一致,都只表示一个维度、一个结构或一个关注的领域。克隆巴赫系数(Cronbachs):对内在一致性系数的测量;计算逻辑:计算每个测试者在每个项目上的得分和总得分之间的相关系数,并与所有单个项目得分的变异性比较;测试中每个项目的得分与总分的变化越一致,这个系数的值就越大。这个系数值越大,就越可确信这个测试是内在一致的,或在测量同一个事物。,使
10、用SPSS计算内在一致性信度,使用SPSS计算内在一致性信度,使用SPSS计算内在一致性信度,使用SPSS计算内在一致性信度,利用SPSS计算效度,效标效度:说明问卷得分与某种外部准则(效标)间的关联程度,用问卷测量得分与效度准则之间的相关系数表示。相关法 结构效度:又称构想效度,是指问卷对某一理论概念或特质测量的程度,即某问卷测验的实际得分能解释某一特质的程度。因素分析法,利用SPSS计算效度:,例如:小学生智力量表,共30个题目:1-6题为想象力;7-12题为思维力;13-18题为观察力;计算校标效度:分别使用这个智力量表和一个得到公认的智力量表(效标)进行施测。分别计算出两个智力量表的总
11、分。分析二者的相关,如果相关很高,则说明这个量表具有较高的效标效度。,50位同学阅读理解成绩频率分布直方图,0,10,20,30,40,50,阅读理解成绩,5,15,25,35,45,55,2,4,6,8,二、正态曲线,200位同学阅读理解成绩频率分布直方图,阅读理解成绩,o,2,4,6,8,样本容量增大时频率分布直方图,正态曲线,可以看出,当样本容量无限大,分组的组距无限缩小时,这个频率直方图上面的折线就会无限接近于一条光滑曲线-正态曲线.,钟型曲线,生活中的正态分布,人的身高高低不等,但中等身材的占大多数,特高和特矮的只是少数,而且较高和较矮的人数大致相近,这从一个方面反映了服从正态分布的
12、随机变量的特点。,矮个,中等身材,高个,不聪明,中等聪明,聪明,少数人,多数人,很小的概率,很小的概率,正态分布的特性1,均值中位数 众数,对称性,渐进性,x,y,与x轴围成的面积为1,均值,标准差,正态分布的特性2正态曲线下的面积,x,y,均值,标准差,34.13%,34.13%,13.59%,13.59%,2.15%,2.15%,.13%,.13%,正态总体几乎总取值于区间 之内,而在此区间以外取值的概率只有0.26。通常认为这种情况在一次试验中几乎不可能发生。【3原则】,最中意的标准值:z值,要对有不同均值和标准差的正态分布进 行比较,需要一定的标准。Z值(z score):标准值,偏离
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 传播研究方法 传播 研究 方法 第十四
链接地址:https://www.31ppt.com/p-5019831.html