因果关系模型课件.ppt
A Causal-Model Theory of Conceptual Representation and Categorization,Bob RehderNew York University,&,概念表征与分类的因果关系模型,实验,引言&因果模型理论,赵珂,作者介绍,A,理论发展,B,Bob Rehder纽约大学心理学副教授(NYU University of psychology)研究方向:Cognition and perception学习经历:a B.A. in Physics and a B.S. Computer Science from Washington University Masters degree in Artificial Intelligence from Stanford University a Masters and Ph.D. in Cognitive Psychology from the University of Colorado.,Last several decades: 有关分类的研究认为人们从经验观察中学习新类别,Categorization models:1、基于表征(representative)的观点【近年来较流行】2、基于原则加工(processing principles)的观点,解释经验观察影响力的模型:a lot! 解释先前已有知识影响力的模型:relatively little,The purpose of this article: 提出一种分类理论,该理论可以解释理论知识的影响效果,尤其是因果关系知识。因果关系知识可以使得人们掌握的类别特征间相互联系、相互影响。,Causal-model theory,类别内特征的表征,连结特征的因果机制的表征,Causal-model theory,决定单个特征在建立类别成员时的重要性,决定不同的特征组合在建立类别成员时的影响,Probabilistic categories: 特征随着他们在类别中的影响力而变化Formal models:特征的权重受到感知觉特点及其在类别内外出现频率的影响,Previous research: 当人们通过与先前观察到的类别成员对比时才对类别间关系敏感Current theories:没有解释领域知识是如何影响特征组合在分类时的作用的,缺点: 忽略了特征权重也能由分类者领域知识决定的事实,1、直接导致的特征比间接导致的特征在类别判断中占据更大权重。2、特征的联合是否符合类别因果关系知识能影响类别判断。,Bird DNAwingsflybuild nests in trees,Claims of causal-model theory:,总之,这篇文章介绍了因果关系模型理论,并用其来解释因果关系知识是如何影响特征及特征的特定组合在类别判断中的重要性。,Natural categories: complex and variable,Novel categories,Natural categories: complex and variable,理论介绍,A,实证统计,B,人们的类别知识不仅包括类别特征,而且包括连接这些特征的因果机制的表征。,C,E,C,b,m,A simple causal model with two binary features and one causal relationship,Central claim:,1、贝叶斯定理(Bayes theorem)是关于随机事件A和B的条件概率(或边缘概率)的一则定理。 其中P(A|B)是在B发生的情况下A发生的可能性。 通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯定理就是这种关系的陈述。,与贝叶斯网络(Bayesian network)进行比较:,2、贝叶斯网络是一系列变量的联合概率分布的图形表示。,3、比较:贝叶斯网络:不能表征网络中直接连接的变量间的因果关系的更多细节内容。因果关系模型理论:假设人们认为特征间是由可能性的因果关系机制相连的。,人们评估一种样例由类别的因果关系模型生成的可能性,以此来做出分类的抉择。,c: 特征C出现的可能性m:当C出现时,连接C和E的概率机制成功运行 (即C导致E的出现)的可能性b:当C不出现时,E出现的可能性,The second major claim:,Likelihood Equations for a causal model with two binary features and one causal relationship,注意:对任意取值范围为01的c, m, b,P(00)+P(01)+P(10)+P(11)=1,与因果关系的必要性(Causal necessity)和充分性(Causal sufficiency)进行比较:,必要性: b=0.即若E出现,则一定是C引起的,若E不出现,则C不出现。,充分性: m=1.即若C出现,则E一定出现,若C不出现,则E不一定出现。,所以说,在因果关系模型中,确定性的因果关系是一种限制性的案例。,在因果关系模型理论中,尽管取值接近充分性和必要性,但是违背因果关系的样例其产生的可能性很低。,链状因果关系模型:,两个假设,1、特征间的三个因果关系是相互独立的,且可能性均为m。,16 possible combinations,P(0110)=(1-c)(b)(m+b-mb)(1-m)(1-b),计算出各种情况下因果关系模型所产生的可能性,那么如何应用到分类判断呢?这取决于被试所面临的选择任务的性质。,1、Two candidate categories: 卢斯的选择公理(Luces choice axiom )P(A|E)=LA(E)/LA(E)+LB(E),2、A single novel category (in this study): Rating(E)=KLchain(E;c,m,b),Causal Models and Derived Empirical Statistics,The central question: 在分类决定任务中,因果关系知识对于特征及特征间联系的重要性所产生的影响。,下面将论证如何导出特征的可能性以及因果关系模型所产生的特征间的相互关系,以此来预测类别成员。分为两部分:1、Feature Probabilities2、Interfeature Correlations,Feature Probabilities,Probability of,Cause features: P(C)/P(F1),参数C,Effect features:,Pi=Pi-1m+b-Pi-1mb,也即Pi=Pi-1m(1-b)+b,可以看出,有3种因素影响Pi,函数,c,m取值不同时,链状模型的特征权重及特征间关系如图所示,上图证明了因果关系机制在特征可能性上的两方面的影响:,1、因果关系机制的出现总能增强效应的可能性。,2、随着原因(cause)特征可能性降低,效果(effect)特征可能性也降低了。,总之,等式Pi=Pi-1m(1-b)+b可推广到任何参数化的因果关系模型。,Interfeature Correlation,YX=P(Y|X)-P(Y|X)(X-cause feature ; Y-effect feature),对于链状因果模型,公式如下:,i,i-1=m(1-b),c,m取值不同时,链状模型的特征权重及特征间关系如图所示,Note:,1、随m的增大而增大,随b的减小而增大。,2、特征间的对比关系在直接相连的因果关系中表现最强(F1&F2,F2&F3,F3&F4);在中间有一个介入量的特征间表现较弱(F1&F3,F2&F4);在中间有两个介入量的特征间表现最弱(F1&F4).,Summary:,总之,因果关系模型理论证明了特征间的因果关系机制是如何自动影响特征所占的比重及特征间的关系类型。,3、实验部分,王雪, 6个新颖的类别:两种是生物 Kehoe Ants Lake Victoria Shrimp两种无生命的自然界的物体 Myastars Meteoric Sodium Carbonate 两种人造类别 Romanian Rogos Neptune Personal Computers),因为很多自然类别的理论知识经常很复杂并且因人而异,所以用新颖的类别进行试验控制,每个特征的基线比率(base rate)是75%,4个二元属性的(binary-attribute):16个,单属性的(single-attribute):8个,因果关系,3个因果关系的描述,1个描述因果关系的图表,每个特征的基线比率(base rate)是75%,4个二元属性的(binary-attribute):16个,单属性的(single-attribute):8个,因果关系,3个因果关系的描述,1个描述因果关系的图表,测验阶段,电脑呈现实验材料,被试可以适合自己的速度来学习,封面故事(cover story)类别特征(categorys features)基线比率(base rate),学习阶段,归类任务,以Lake Victoria Shrimp为例,封面故事(cover story),学习阶段 实验组,封面故事(cover story),学习阶段 控制组,测验阶段,分类任务,Is this a Lake Victoria Shrimp?,Seventy-two University of Colorado at Boulder under-graduates assigned in equal numbers to the chain and control conditions,and to one of the six experimental categories.,75%的基线比例的特征对类别等级评定产生了效果,和对照组相比,实验组中特征间存在的因果关系影响了类别等级评定,被试对具有不同特征的样例进行类别等级评定所得结果的平均,实验数据的统计分析,方差分析结果也支持上述结论,对六个种类(categories)进行方差分析,结果表明种类对等级评定没有影响,领域一般性(domain general),对条件(control & chain)和样例(16 levels)的二因素方差分析,条件的主效应显著,样例的主效应显著,条件和样例的的交互作用显著,特征概率,对被试的等级评定结果进行调节,使每个被试对16个样例的等级评定结果总和为1,计算特征概率:计算某特征,就把包含该特征的所有样例的概率加起来,比如P1=P(1000), +P(1001)+P(1010)+P(1011)+P (1100)+P(1101)+P(1110) +P(1111),16个概率,results,特征概率分析结果,实验组和控制组的所有概率都大于0.5,特征存在增加类别评定等级,特征缺失减小类别评定等级,实验组中F1的概率大于F2,F3和 F4;控制组中F1、F2、F3、F4的概率几乎相等,results,方差分析结果,特征(F1、F2、F3、F4)和条件(控制组和实验组)的双因素方差分析,条件和特征间有显著的交互作用,表明特征概率在两种条件下的模式不同;,对实验组的四个特征的单因素方差分析表明,F1显著大于F2、F3、F4;F2、F3、F4间没有显著差别,特征间比较,对被试的等级评定结果进行调节,使每个被试对16个样例的等级评定结果总和为1,计算特征间比较的概率:计算过程为比如,16个概率,results,特征间比较的分析结果,实验组中直接连接的两特征间的比较21, 32, 43都大于0,存在由因果关系直接连接的两特征增加了类别等级评定,并且这种效应是比单个特征本身影响大的,控制组中六个特征间的比较几乎都等于0,特征间比较( 21, 32, 43 31, 41, 42 )和条件(控制组和实验组)的双因素方差分析,条件和特征间比较有显著的交互作用,表明特征间比较在两种条件下的模式不同;,对实验组的六个特征间比较的单因素方差分析表明,,在没有因果关系的条件下,两特征间的连接对类别等级评定没有影响,直接连接的特征间比较( 21, 32, 43)显著大于间接连接的特征间比较(31, 41, 42 ),results,理论模型,实验中被试的等级评定数据,通过因果理论模型预测的16个样例的概率,?,results,违背因果原则的样例,遵守因果原则的样例,链接因果模型很好地单个特征的权重和特征间相关的敏感性,discussion,因果模型理论和只考虑特征权重的理论的比较(比如因果等级假设),本实验的结果验证了因果模型中对特征重要性和特征间比较的预测,和其他三个特征相比,特征1明显重要,由因果关系连接的特征间的直接比较有显著的作用,在因果网络之中更加原因的特征对归类更重要(比如XYZ,则重要性:XYZ),本实验结果只能部分证明因果等级假设:因为虽然F1在等级类别评定中的重要性大于F2、F3、F4,F2、F3、F4三个的重要性没有差别,本实验中被试还考虑特征对是否符合因果原则,概率因果机制,充分必要关系,m=1,b=0,实验二和实验一的实验材料和实验过程都一样,除了实验一中所有特征75%的基线比率这一条件删除了,实验二没有告诉被试特征的基线比率,这一操作有两个原因:1、实验一中除了F1,其他三个特征的概率几乎相等,这可能是因为被试事先被告知所有特征75%的基线比率,让被试认为所有特征的概率是一样的2、实验一中间接连接的特征间没有相关,可能是因为被试只注意了75%的基线比率,Seventy-two University of Illinois at UrbanaChampaign undergraduates assigned in equal numbers to the chain and control conditions,and to one of the six experimental categories.,实验组中样例0101和1010的类别评定等级显著低于控制组,另外样例1111在实验组中显著高于控制组,实验条件(控制、对照)和样例水平(16)的双因素方差结果表明,这两个因素间存在显著交互作用,被试对具有不同特征的样例进行类别等级评定所得结果的平均,特征概率和特征间比较的计算,对被试的等级评定结果进行调节,使每个被试对16个样例的等级评定结果总和为1,计算特征概率:计算某特征,就把包含该特征的所有样例的概率加起来,比如P1=P(1000), +P(1001)+P(1010)+P(1011)+P (1100)+P(1101)+P(1110) +P(1111),16个概率,results,特征概率的分析结果,更原因的特征的权重更小,条件的主效应,实验组的特征概率大于控制组,特征(F1、F2、F3、F4)和条件(控制组和实验组)的双因素方差分析,没有特征的基线比率,控制组的特征的权重都差不多等于0.5,即随机水平,无交互作用,实验条件和特征比较的二因素方差分析结果表明:1、实验条件的主效应显著,即实验组的特征比较概率大于控制组;2、实验条件和特征比较间存在交互作用,特征间比较,实验组和控制组特征间比较的模式不同实验组中直接连接的特征都大于0,表明当特征间的配对符合因果原则时等级评定结果大 控制组中的六个特征间对比几乎等于0,对实验组的特征间直接连接和间接连接的方差分析表明直接连接的特征比较大于间接连接,discussion,确定更原因的特征(F2、F3)是否比F4更重要,本实验是为了评估被试在没有特征的基线比率的条件下的因果原则的使用,实验2中的m=0.402m=0.120(实验1中),表明实验2中更强因果原则的使用,更原因的特征的权重更小,改变实验一和实验二的实验材料,使F1成为类别的定义性特征,For example, Lake Victoria Shrimp wererenamed to Acetylcholine Shrimp and participants were told that allacetylcholine shrimp have high amounts of acetylcholine and that no other kind of shrimp does.,测验阶段,电脑呈现实验材料,被试可以适合自己的速度来学习,封面故事(cover story)类别特征(categorys features:FI(?) 是定义性特征并且未知的),学习阶段,归类任务,以Acetylcholine Shrimp为例,封面故事(cover story),学习阶段 实验组,测验阶段,分类任务,Is this a Acetylcholine Shrimp?,封面故事(cover story),学习阶段 控制组,测验阶段,分类任务,Is this a Lake Victoria Shrimp?,同实验1,2一样,连接类别特征的因果知识的呈现能影响被试的类别等级评定。,相比于控制组,实验组对于那些违背因果关系的样例给予更低的评定等级。,Feature probabilities:,实验3的目的是决定不被观察到的基本特征是否会产生期望的变化模式,也即特征的权重在链状模式中不断降低。,从左图可知,实验组的数据跟期望的预测是一样的。而控制组特征权重基本一样。说明受到因果关系知识的影响。,Interfeature contrasts:,该图也显示了实验组和控制组的不同。,实验三的目的是探讨当因果链中的根特征是定义性特征时的特征权重的模式,之前的研究表明因果链中的前面的特征有更多权重,实验三出现了这种效应,因为未知的不变的根特征的存在(?),和实验1、2一样,由因果关系直接连接的特征间的比较显著大于0,虽然F1是未知的,讨论&结论,赵珂,模型比较及讨论,A,结论,B,与基于相似性样例模型比较,Similarity-based exemplar model(Medin Nosofsky,1986),(a)基于相似性样例模型是通过计算与记忆中存储的类别样例的相似性来进行类别判断的,而在本研究实验13中,被试学习新的类别时并没有观察类别样例,因此可将实验结果归因于因果知识(causal knowledge)而不是先前存储的类别成员(previously observed category members)。,(b)当呈现类别的因果关系知识时,基于相似性样例模型在类别判断任务中无法解释特征间的相互关系。,(c)需要二阶属性(second-order features)来解码因果关系特征。e.g. exemplar01100110010 VS 1111111,General Discussion,实验结果证明,人们在给新的客体分类时,是通过评估该客体所呈现的特征组合是否可能由因果关系规律产生的。,因果关系模型的良好的适用性体现在当被试进行登记评定时,该模型不仅能成功模拟出单个特征的重要性的变化,而且能模拟出特征间的联系。,近年来实证研究发现,客体所被认为的潜在的特征对于建立客体类别成员是至关重要的。因果关系模型不仅标准化了观测特征间的关系,还包括了产生它们的不能观测的特征。特征的重要性是由暗含的因果机制决定的,在这点上因果关系模型与其它模型不同。,除了能预测单个特征的重要性变化外,因果关系模型还解释了特定特征组合中的因果知识的影响。,实验三有力地证明了人们在类别判断时,不仅基于不可观察到的定义性特征,而且还基于不可观察到的因果关系机制的出现。,本研究最初目的是建立因果知识在分类时的独立影响,因此与许多以往研究不同的地方在于,没有给被试提供类别成员的范例,即基于理论研究而非实证研究。,首先,独立研究理论知识本身就是有趣的事情。,其次,以往研究类别判断时提供大量范例,这也可能影响分类判断。,(a)研究中导出的参数估计证明了人们把因果关系视作是由可能性的因果机制构成的,而不是一种充分性和必要性的确定关系。,首先,在三个实验中,对于参数m的估计均小于1。,其次,对于参数b的估计均大于0。,(b) 该实验中提到的因果知识表征是关于二元特征的,而真实世界里的类别包含各种其它特征,并且因果关系机制也不仅仅只是特征的组合。,因果关系模型可以预测人们是如何在顺序变量、称名变量以及连续变量网络内进行分类判断的。,因果关系模型还可以预测人们是如何在包含多于两个变量的因果机制网络内进行分类判断的。,总之,因果关系模型在人们相信因果机制可以运行的任何领域都适用。,Conclusion,本文论证了因果知识在分类判断中的重要性。不仅解释了特征权重的不同,而且说明了特定特征组合对于类别成员判断的影响。因果关系模型具有良好的预测效果,并广泛适用于实证数据。与其它模型进行比较时也支持严格的测试。,Dec 2012,赵珂&王雪,THANK YOU,此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!,