问卷编制与分析.ppt
《问卷编制与分析.ppt》由会员分享,可在线阅读,更多相关《问卷编制与分析.ppt(104页珍藏版)》请在三一办公上搜索。
1、问卷编制与分析,主要内容,量化研究与统计分析量化研究的基本概念量的研究与质的研究的区别量的研究设计方法量的研究步骤量表分析步骤量表的编码项目分析因素分析信度分析复选题及其他方式的数据文件建立,1、量化研究的基本概念,研究的两种取向(两个范畴)量化研究(定量研究)质性研究(定性研究)量化研究的基本概念研究的目的:描述、解释、预测研究的特性:客观性、系统性、实证,2、量的研究与质的研究的区别,对问题看法逻辑实证主义:单一的客观实在自然现象主义:多元实在研究目的变量间的必然性的因果关系或相关关系对情境关系的诠释与分析研究取向假设演绎假设(特殊条件下的)验证归纳法经验归纳研究者角色客观中立价值参与研究
2、结果推论由样本推论到样本的总体,强调情境的重要性情境限制推论,3、量的研究设计方法,调查法访问调查法问卷调查法相关研究法实验法真实验设计准实验设计量化研究的主要特征是经过观察、测验、量表、问卷以取得研究实施的数据资料,作为假设检验的基础。因此,搜集、整理、统计分析是其基础。,4、量的研究步骤,选择与定义问题执行研究的程序数据分析结果分析与结论,1)、选择与定义问题,研究问题必须是可以检验的假设,是领域的感兴趣、有价值或重要性的问题,问题可以经过资料搜集、分析来加以检验或回答。研究问题确定后,要给予完整的操作性的定义。,2)、执行研究的程序,实施的程序包括:样本或被试的选择抽样方式对象的要求、代
3、表性样本量测量工具的改进编制、修订、完善数据的搜集数据的类型、统计方法的选择,3)、数据分析,根据数据的性质和特点,选择合适的统计分析方法进行客观的解释及推论。,4)、结果分析与结论,检验假设是否能被支持。推论到特定情境得出一般结论。,研究者如采实验研究时,应当把握下列四大原则(Kirk,1995):,1)要有适切的统计检验力,使和o间差异,有实质意义存在。2)使用最小资源、人数。3)提供适当的保护,以防止第一类型的错误。4)无关干扰变量的影响要最小。,在实验设计的选择上面,除把握以上四个原则外,也要考虑到下面五个方面:,1)这个设计能够有效计算出实验效果与误差效果值?团为由这两个效果值才能得
4、知实验处理是否有效。2)所搜集的数据足以产生可靠的结果?如果所搜集的数据有偏误,统计结果自然不正确。3)设计是否可运用适当的统计方法加以检验,而检验结果是否具有足够的统计检验力?量化的数据如果不能以统计方法检验,则无法验证:此外,统计检验力人低,也代表正确裁决率不高。4)在实验情境限制下,此设计是否是最有效率,也最经济化的设计5)实验程序是否具体可行?在研究领域中所学的方法是否可以使用?在研究情境类似下,研究者之研究结果应能与其它研究者的发现作一比较。,样本的代表性,赋予概念的操作型定义,才能具体表达概念所代表的意义,也才能由外在的观察与测量而得知概念的层次。在样本的选择上,最重要的是样本要有
5、高的代表性,愈有代表性的样本,类推样本母群的性质就愈正确。对母群体而言,选取的样本是否具有代表性,根据下列三项因素而定:一是选取的样本大小是否足够二是样本选取时抽样的方法是否恰当三是从样本处所获得的数据是否精确,代表性是取样的基本准则,也是判定受试者适当与否的主要依据,常用的取样方法有三种(Gay,1992):,1)随机抽样:依据概率理论,以随机原则方式从母群体中抽取定比例的受试者(取样对象为观察值个体),使用方法如抽签法、随机乱数表抽样等。,2)分层随机抽样,研究设计中,如果受试各母群间的差异很大(异质性很高),或某些样本点很少,为顾及小群体的样本点也能被抽取,应采用分层随机取样较为适宜。在
6、实施上,研究者根据研究关注的准则,先将母群体分成几个互斥的若干层(不同的小群体),各层间尽可能异质、而各层内尽可能同质,然后从每层中利用随机取样方式,依一定比例各抽取若干样本数。分层随机抽样的步骤如下(Gay,1992):确认与界定研究的母群体。决定所需样本的大小。确认变量与各子群(层次),以确保取样的代表性。依实际研究情形,把母群体的所有成员划分成数个层次。使用随机方式从每个子群中,选取适当的个体;适当的个体意指按照一定的比例人数或相等人数。,分层随机抽样的图标如下:,3)整群抽样法:,如果样本所属母群体的很大或涵括的地理位置很广,则采用整群抽样法较为简宜。整群抽样法是以一个群组或一个团体为
7、抽取单位,而不以个人为取样单位,因而整群抽样法抽取的样本点是一个群组、一个群组,群组与群组间的特征非常接近,同构型很高;而群组内彼此成员的差异较大,异质性高。在社会科学领域中,整群抽样的群组如班级、学校、组别、部门、学区等。整群抽样的步骤如下:确认与界定母群体。决定研究所需的样本大小。确认与定义合理的组群。列出母群体所包括的所有组群。估计“每个组群中平均母群成员的个体数。以抽取的样本总数除以组群平均个体数,以决定要选取的组群数目。随机取样方式,选取所需的组群数。每个被选取之组群中的所有成员即成为研究样本,整群抽样的图标如下:,两大随机原则:,样本选取时,最重要的是样本要有代表性,才能从受试样本
8、群体推论到其母群体的性质,受试样本要有代表性,了重要的方法就是要把握“随机取样”与“随机分配”两个原则。,取样的样本要多少才算“够大”?,在研究设计中,受试者的数目要多大才算具有代表性,多少位样本才算“够大”,这个议题,社会科学研究领域中,似乎无一致的结论。其中,学者Sudman(1976)提出的看法,可供参考:初学者进行与前人相类似的研究时,可参考别人的样本数,作为自己取样的参考。如果是地区性研究,平均样本人数在500至1000人之间较为适合;而如果是全国性研究,平均样本人数约在1500人至2500人之间较为适宜。学者Gay(1992)对于样本数多少,则提出以下看法:描述研究时,样本数最少占
9、母群体的10,如果母群体较小则最小的样本数最好为母群体的20相关研究的目的在于探究变量间的有无关系存在,受试者至少须在30人以上。因果比较研究与许多实验研究,各组的人数至少要有30位如果实验研究设计得宜,有严密的实验控制,每组受试考至少在15人以上,但权威学者还是认为每组受试者最少应有30人,最为适宜。,注意:,考虑研究实际情境与研究间差异,抽取样本时如局限于“绝对数量”多少,较为不宜。因为各母群体性质不同,异质性很高,包含个体数差异也很大。所以可接受之受试样本数准则只是一种参考指针,因为“如果取样方式不当,虽然选了很大的样本,代表性很低,还不如以适当抽样的方法,选取有代表性的小样本”学者Bo
10、rg与Gall(1983)二者即认为,样本数多少受到多种变量的影响,在下列几种条件或情境中,要采较大的样本数:编制之测量工具的“信度”(可靠性)较低时。研究进行中有较多变量无法控制时。母群体的同构型很低时。统计分析时,受试者须再细分为较小的各群组来分析比较时实验设计时,预期会有较多受试者中途退出时。,变量的分类,数据分析之变量属性的分类中,多采纳学者Stevens(1946、1951)的观点,Stevens的看法中,乃根据测量量表或测量水准的基准,将变量属性类别划分成以下几种:1名义变量或称类别变量主要在于分类对象,把对象转变为间断类别,变量主要属性只是用来辨识事物或表示事物的类别而己,如性别
11、、种族等。2次序变量变量除只有分类特性外,又具有等级排序关系:变量间根据菜个准则,可将对象由最高至最低作有规则的排序,变量主要属性在于可用数值表示对象间之优劣、多少、高低、次序等。3等距比率变量等距变量除可表示对象类别及比较大小次序外,对象类别间距离是相等的,出而变量间有“可加性”。如果对象类别间存有绝对的零点,则称为比率变量,比率变量间问有“可乘性”,二者均属连续变量。,在社会科学领域中,学者不会特别在意等距变量与比率变量间划分,因为社会科学中,真正的等距变量往往也是比率变量,如收入、午龄等;加上等距变量与比率变量所适用的统计方法并无不同,二者均含合算术计算特性,因而两个变量常被合而为,数据
12、分析中,似乎个必严格区分变量是属等距变量或比率变量。在社会科学中,常用的李克特式之多选项量表,严格说起来,量友之变量性质足一种次序变量,但次序变量与名义变量均属“间断变量”,间断变量无法求其平均数、或进行相关、回归等统计分祈,因而无法验证相关的研究假设,所以多数研究者在编制多选项量表时,皆把量表视为等距变量来设计,此类等距变量也可转化为不同类别,它虽然不是“真正”等距变量,但多假定具有真正等距变量的性质,如此,才能进行有意义的数据统计分析与归纳出合理的结论。,此外,在社会科学领域中,灼一个常见的变量为“一分变量”,此变量被视入名义变量或次序变量,均届于间断交量,对象届性只分为二大类别,如“男”
13、、“女”;“及格”、“不及格”等。如果间断变量有三大类或三个水准时,则称为“三分变量”,如包含三个类别以上或三个水准以上的间断变量,又称为“多分变量”。在变量属性的转换上,等距比率变量可转化为次序变量或名义变量,如依某一分量表之得分高低,将样本分成“高分组”、“中分组”、“低分组”,但次序变量或名义变量不能转换为等距变量比率变量,如要转换,常用者为以虚拟变量方式出现(有关虚拟变量的转换与应用,请参考多元回归分析一章)。,二、量表分析步骤,在问卷调查法或实验研究法中,研究或调查工具编制甚为重要,问卷如果编制或选用得宜,则研究才更具可靠性与价值性。我们首先说明问卷信效度分析的简要步骤。各步骤的操作
14、方法则分别在以后详细说明。问卷信效度分析的步骤,简要分述如下:编拟预试问卷预试整理问卷与编号项目分析因素分析信度分析再测信度,1、编拟预试问卷,在预试问卷的编制或修订上,应根据研究目的、相关文献数据与研究结构等方面加以考虑,如果有类似的研究工具,可根据研究当时的实际情形,加以修订、增删;如果是自己重新编制问卷,问卷内容应依据研究结构的层面,加以编制,在编制问卷时应注意:1如果问卷的题项内容过于敏感,应在间卷中穿插数题“测谎题”,以探知填答者是否据实填答。2态度量表通常采用的是李克持式量表法,量表填答方式以4点量表 法全6点量表法,最为多人或研究者所采用。,对于应采用几点量表法,学者Berdie
15、(1994)根据研究经验,综合提出以下看法,可供研究者参考:,在大多数的情况下,5点量表是最可靠的,选项超过5点,一般人难有足够的辨别力。3点量表限制了温和意见与强烈意见的表达,五点量表则正好可以表示温和意见与强烈意见之间的区别。由于人口变量的异质性关系,对于没有足够辨别力的人而吉,使用7点量表法,会导致信度的丧失;对于具有足够辨别力的人而言,使用5点量表,又令人有受限的不适感。以上问题至目前还没有一个很好解释理由,然而透过预试,可以发现这些问题的存在。量表的点数愈多,选答分布的情形就愈广,变异数也会变得更大,有些人认为这种情形在统计检验上会只有很好的区别力,然而,(1)这种选答很广的分布缺乏
16、可信度,故完全没有意义;(2)较大的选答变异数,表示也会有较大的抽样误差,就统计数据分析的意义而言,是不该有太大的变异数的。,题项数的多少为好?,李克特式量表法,重视其“内在一致性程度”,这是量表题项两两之间关系强度的函数,也是题项与潜在变量间的关系指针,函数值大小与题项数多寡有密切关系,题项数愈多,愈有可能涵括所要测量的潜在变量;不过,题顶数过多,在实际研究情境中多数会有实际的困难,如受试者时间不允许或造成填答者不用心作答等。学者Devellis(1991)对于预试问卷题项数提出以下两点看法,可作为研究者参考:1如果研究者是编制或发展一个正式的测验或量表,作为其它心理测量之用,则预试题项数最
17、好是将来所需正式题项总数的3、4倍。2、在某些特定内容范围中,有些量表题项的发展不容易;或先前相关的研究显示,这些 设想不需要过多的题项即可获得良好的内在一致性,预试量表的题项数约为正式量表 题项数的1.5 倍即可,如正式量表题项数预计在20题附近,则预试问卷时,其预试 题项数大约为30题。,2、预试,预试问卷编拟完后,应实施预试,预试对象的性质应与将来正式问卷要抽取的对象性质相同,如研究对象为中学生,则预试之受试者也应为中学生,预试对象人数以问卷中包括最多题项之“分量表”的35倍人数为原则,如调查预试问卷中,包括三种分量表,每各分量表包含的题项分别为40题、35题、25题,则预试对象,最好在
18、120位至200位中间,如果样本较为特殊,在预试人数的选取上可考虑再酌减一些。预试时选取样本数应该多大最为适宜?应考虑问卷量表是否进行因素分析。因为因素分析时,以较大样本分析所呈现的因素组型,比一个只用较小样本所出现的因素组型,要来得稳定。进行因素分析时,量表的题项数愈多及预期要有较多的因素层面的话,进行因素分析时,应包括愈多的受试者(DeVellks,1991)。学名Tinsley和Tinsley(1987)建议,进行因素分析时,每个题项数与预试样本数的比例大约为1:1至1:10之间,如果受试者总数在300人以上时,这个比例便不是那么重要。最近,另一学者Comrey(1988)也提出另一观点
19、,如果量表的题项数少于40题,中等样本数约是150位,较佳的样本数是200位。其观点与Tinsley二者接近,亦即量表题项数与预试人数比例约为1:1最为适合。,3、整理问卷与编号,问卷回收后,应一份一份检查筛选,对于数据不全或不诚实填答之间卷,应考虑将之删除;对于填答时皆填同性答案者是否删除,研究者应考虑问卷题项本身的内容与描述,自行审慎判断。筛选完后的问卷应加以编号,以便将来核对数据之用;之后再给予各变量、各题项个不同代码,并依问卷内容,有顺序的键入计算机。SPSS可以读取文本文件、excel等文件,可以选择自己得手的程序输入。,量表的编码,变量名对于题项较多的量表一般以题项作为变量名变量名
20、是唯一的,不能重复,不能用数字,不能有空格对于量表所涉及的基本信息部分一般以中英文来标识变量,为便于输入,减少输入法的转换及全角半角的影响,建议使用英文或汉语拼音。如果使用计算机比较熟练,用汉字也有其优点如性别、年龄、职业等用SEX、AGE、JOB或XINGBIE、NIANLING、ZHIYIE等对于12.0以前的版本,变量名仅限8个字符。,量表的编码,变量名对于各分量表要使用相同的识别码使用题目序号标识不同的题项如A1、A2表示量表A的各题项,B1B2表示量表B的各题项各反向计分题在变量名中进行标识,以方便后续运算,量表的编码,变量名标签对于量表所涉及的基本信息部分为便于显示和以后的报告撰写
21、,建议使用中文标签SPSS12.0以前的版本,变量名仅限8个字符,不能清楚表示时,可以使用变量名标签。对于各分量表生成的新变量名,如量表总分,子量表均分可用变量名标签,量表的编码,变量值标签对于量表所涉及的基本信息部分一般用变量值标签来加快输入的速度减少以后分析操作过程的诸多不便变量值标签可以使用中英文,如果英文不特别好,建议使用中文。如性别:男女用1、2或0、1标识职业:工人、农民等用1、2等表示对于变量的类型,除非必须(如姓名、学号等)用字符串外,我们都选择用数值型变量。,量表的编码,变量值标签对于各分量表原题项一般不用变量值标签对于新生成的称名变量、顺序变量最好使用变量值标签如:总分分组
22、中的高、中、低三组按量表标准计算出的心理问题的检出率,如重度焦虑、中度焦虑、轻度焦虑、无焦虑等,量表的编码,变量的类型除非必须(如姓名、学号等)用字符串外,建议全部选用数值型变量。对于称名变量和顺序变量则用变量值标签来标识其涵义变量的测度水平对于量表基本部分的称名变量和顺序变量分别标识其测度水平对于分量表计算而生成的称名变量和顺序变量最好也标识其测度水平各题项及新生成的多数变量则用连续变量标识其水平,4、项目分析,作用:项目分析主要目的在求出问卷个别题项的临界比率值CR值将未达到显著水平的题项删除,减少题量。主要方法独立样本T检验相关法数据:Cha-2.sav,项目分析即在求出每一个题项的“临
23、界比率”(简称CR值),其求法是将所有受试者在预试量表的得分总和依高低排列,得分前25至33者为高分组,得分后25至33者为低分组,求出高低二组受试者在每题得分平均数差异的显著性检验(多数数据分析时,均以测验总分最高的27及最低的27,作为高低分组界限),如果题项的CR值达显者水准(0.05或0.01),即表示这个题项能鉴别不同 受试者的反应程度,此为题项是否删除首应考虑的。,主要方法,独立样本T检验:量表题项的反向计分题的处理(916,若无则可省略)利用Record into Same命令将反向题导入右侧框中定义转换的数值关系注意:先保存原始数据文件。求出量表总分利用Compute命令输入新
24、变量名即总分建立数学关系式,即连加量表总分高低排序利用Sort Case命令将总分加入右侧框中选择排序方法找出高低分组上下27处的分数,按临界分数将总分分成高低二组利用Record into Different命令先定义变量:总分组组将临界值以下的定义为1组(43,低分组)将临界值以上的定义为2组(56,高分组)以独立样本T检验检查二组在每个题项的差异利用Independent-samples T Test 命令将所组题项导入右上侧框中选择总分组变量作为自变量并定义其值1、2将T检验的结果未达到显著性的题项删除根据方差齐性检验结果选择t检验的值及显著性确定需要删除的题项(本例全部显著),查看结
25、果,主要方法,相关法:量表题项的反向计分题的处理(若无则可省略)求出量表总分计算各题项与总分的相关利用Bivariate命令为便于观察,先选择总分进入右侧再选择所有题项依原来顺序进入右侧选择积差相关法根据各题项与总分相关系数的显著性及相关系数的大小决定取舍题目的标准。,5、因素分析结构效度,项目分析完后,为检验量表的结构有效度,应进行因素分析。所谓结构效度系指态度量表能测量理论的概念或特质之程度。因素分析目在于检验量表的“建构效度”即找出量表潜在的结构,减少题项的数日,使之变为一组较少而彼此相关较大的变量,此种因素分析方法,是一种“探索性的因素分析”,5、因素分析结构效度,研究的效度包括内在效
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 问卷 编制 分析
链接地址:https://www.31ppt.com/p-5884819.html