欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOCX文档下载  

    用身高与体重数据进行性别分类的实验报告.docx

    • 资源ID:1862714       资源大小:136.70KB        全文页数:9页
    • 资源格式: DOCX        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    用身高与体重数据进行性别分类的实验报告.docx

    用身高和体重数据进行性别分类的实验报告姓 名:刘懿郴 学 号:2009302308 范 英 学 号: 2009302316 胡 亮 学 号: 2009302319 班 级:93911、 基本要求 用FAMALE.TXT和MALE.TXT的数据作为训练样本集,建立Bayes分类器,用测试样本数据对该分类器进行测试。调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。2、具体做法 (1)应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关,在正态分布假设下估计概率密度,建立最小错误率Bayes分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同先验概率(如0.5 vs. 0.5, 0.75 vs. 0.25, 0.9 vs. 0.1等)进行实验,考察对决策和错误率的影响。 (2) 自行给出一个决策表,采用最小风险的Bayes决策重复上面的实验。3、实验原理 已知样本服从正态分布, (1)所以可以用最大似然估计来估计和两个参数 样本类分为男生和女生两类,利用最大似然估计分别估计出男生样本的,和女生样本的,然后将数据带入(1)公式分别计算两者的类条 件概率密度和,然后根据贝叶斯公式计算出两类的后验概率和实验一:对于两类情况,我们可以仅定义一个判别函数: 其中 = = 并将决策规则表示为 如果 >0,则决策; <0,则决策。 实验二:我们定义一个决策表如下图 损失状态 决策0620我们定义判别函数并将决策规则表示为 如果 >0,则决策; <0,则决策。xx>0? 输入数据样本集带入判别函数 N Y 实验流程图4、实验结果 利用matlab我们计算出了male.txt 和female.txt的均值和协方差,和,这样我们可以利用公式和判别函数与决策规则对训练/测试样本集进行分类,结果如下:(1) 当体重和身高相关的时候 对于test1测试集,总体来说,对样本集的判断正确率随着男性的先验概率的增加(女性先验概率的减少)先增大后减小,而对于男性或者女性的的个体判别随着男性的先验概率的增加而正确率不断增加或不断减小(也就是随着男性先 验概率的增加,将男性判断为女性的概率越来越少,甚至没有;而把女性判别为男性的概率越来越大)而对于test1测试集,对样本集的判断正确率随着男性的先验概率的增加(女性先验概率的减少)而不断增加,而对于男性或者女性的的个体判别随着男性的先验概率的增加而正确率不断增加或不断减小(也就是随着男性先验概率的增加,将男性判断为女性的概率越来越大;而把女性判别为男性的概率越来越小)(2)当体重和身高不相关的时候 对于test1测试集,总体来说,对样本集的判断正确率随着男性的先验概率的增加(女性先验概率的减少)先增大后减小,而对于男性或者女性的的个体判别随着男性的先验概率的增加而正确率不断增加或不断减小(也就是随着男性先验概率的增加,将男性判断为女性的概率越来越少,甚至没有;而把女性判别为男性的概率越来越大)而对于test1测试集,对样本集的判断正确率随着男性的先验概率的增加(女性先验概率的减少)而不断增加,而对于男性或者女性的的个体判别随着男性的先验概率的增加而正确率不断增加或不断减小(也就是随着男性先验概率的增加,将男性判断为女性的概率越来越大;而把女性判别为男性的概率越来越小)(3)当体重和身高相关的时候 对于test1测试集,总体来说,对样本集的判断正确率随着男性的先验概率的增加(女性先验概率的减少)先增大后减小,而对于男性或者女性的的个体判别随着男性的先验概率的增加而正确率不断增加或不断减小(也就是随着男性先 验概率的增加,将男性判断为女性的概率越来越少,甚至没有;而把女性判别为男性的概率越来越大)而对于test1测试集,对样本集的判断正确率随着男性的先验概率的增加(女性先验概率的减少)而不断增加,而对于男性或者女性的的个体判别随着男性的先验概率的增加而正确率不断增加或不断减小(也就是随着男性先验概率的增加,将男性判断为女性的概率越来越大;而把女性判别为男性的概率越来越小)(4)当体重和身高不相关的时候 对于test1测试集,总体来说,对样本集的判断正确率随着男性的先验概率的增加(女性先验概率的减少)先增大后减小,而对于男性或者女性的的个体判别随着男性的先验概率的增加而正确率不断增加或不断减小(也就是随着男性先 验概率的增加,将男性判断为女性的概率越来越少,甚至没有;而把女性判别为男性的概率越来越大)而对于test1测试集,对样本集的判断正确率随着男性的先验概率的增加(女性先验概率的减少)而不断增加,而对于男性或者女性的的个体判别随着男性的先验概率的增加而正确率不断增加或不断减小(也就是随着男性先验概率的增加,将男性判断为女性的概率越来越大;而把女性判别为男性的概率越来越小)。5.结果总体分析由实验结果可知,对测试集的测试数据表明,最小错误率的贝叶斯分类器在假设两特征相关的情况下,男生类与女生类的先验概率与事实越接近既各为0.5时其准确率越高,当男生的先验概率大于女生时,容易将女生误判为男生,当男生的先验概率小于女生时,容易将男生误判为女生,在假设两特征不相关时分类器对先验概率依赖较小且准确率较高。而对样本集的测试数据则表明女生先验概率大于男生时分类器的准确率较高,假设两类特征不相关时其准确率变化不大,但女生先验概率较大时对男生的误判较多,男生的先验概率较大时对女生的误判较多。最小风险的贝叶斯分类器假设两类特征相关时,男生类与女生类的先验概率与事实接近既各为0.5时其准确率较高,由于男生误判为女生的损失较大,所以男生的先验概率越大则将女生误判为男生的概率越高,准确率则较低,女生的先验概率较高时分类器准确率较高,假设两类特征相关时,情况与不相关时类似,说明最小风险的贝叶斯分类器对先验概率依赖程度较高而对特征之间是否相互独立关系不大。另外,对样本集的分类测试正确率明显低于测试集,分析认为是由于样本分布并不十分近似正态分布,且数据分布比较分散,而测试集的数据却恰好较严格服从正态分布且数据分布比较集中。6.实验心得通过实验更加深刻地理解了贝叶斯分类器的设计过程以及模式识别的流程,通过实验了解了所学知识的实用价值,明白了最大似然估计,最小错误率的贝叶斯分类器与最小风险的贝叶斯分类器的优缺点与适用情况。通过讨论解决实验中遇到的问题,明白了书中的公式不止需要记忆,还需要理解,明白了团队分工协作的重要性。7.相关实验代码(1)当体重和身高相关的最小错误率分类期代码 clear all;pw1=input('ÄÐÉúµÄÏÈÑé¸ÅÂÊ£º')pw2=input('Å®ÉúµÄÏÈÑé¸ÅÂÊ£º')male1=0;female1=0;error11=0;error12=0;male2=0;female2=0;error21=0;error22=0;%²âÊÔÑù±¾t1H t1W=textread('E:´óÈýÏÂѧÆÚģʽʶ±ðģʽʶ±ðʵÑétest1.txt','%f %f %*s');t2H t2W=textread('E:´óÈýÏÂѧÆÚģʽʶ±ðģʽʶ±ðʵÑétest2.txt','%f %f %*s');HW1=t1H t1W;HW1=HW1'HW2=t2H t2W;HW2=HW2'number1=length(HW1) ; %test1(15,20)µÄ¸öÊýnumber2=length(HW2) ; %test2(50,250)µÄ¸öÊýfor n=1:20 a=HW1(:,n); u11=173.9200;65.5020;thegema11=20.7536 23.0582;23.0582 59.8982;%ÄÐÉú u12=162.8400;52.5960;thgema12=43.9344 15.5254;15.5254 31.1285;%Å®Éú det11=det(thegema11);det12=det(thgema12); p(11)=1/(2*pi)*(det110.5)*exp(-1/2*(a-u11)'/thegema11)*(a-u11); p(12)=1/(2*pi)*(det120.5)*exp(-1/2*(a-u12)'/thgema12)*(a-u12); pz=p(11)*pw1+p(12)*pw2; p11=(p(11)*pw1)/pz;p12=(p(12)*pw2)/pz; g=p11-p12; if (g>0)%Ñù±¾¼¯Ç°15¸öÈËÊÇÄÐÉú male1=male1+1; else error11=error11+1; endend male1 error11 for n=21:number1 a=HW1(:,n); u11=173.9200;65.5020;thegema11=20.7536 23.0582;23.0582 59.8982;%ÄÐÉú u12=162.8400;52.5960;thgema12=43.9344 15.5254;15.5254 31.1285;%Å®Éú det11=det(thegema11);det12=det(thgema12); p(11)=1/(2*pi)*(det110.5)*exp(-1/2*(a-u11)'/thegema11)*(a-u11); p(12)=1/(2*pi)*(det120.5)*exp(-1/2*(a-u12)'/thgema12)*(a-u12); pz=p(11)*pw1+p(12)*pw2; p11=(p(11)*pw1)/pz;p12=(p(12)*pw2)/pz; g=p11-p12; if (g<0)%Ñù±¾¼¯test1ºó20¸öÊÇfemale female1=female1+1; else error12=error12+1; endend female1 error12 for n=1:50 a=HW2(:,n); u11=173.9200;65.5020;thegema11=20.7536 23.0582;23.0582 59.8982;%ÄÐÉú u12=162.8400;52.5960;thgema12=43.9344 15.5254;15.5254 31.1285;%Å®Éú det11=det(thegema11);det12=det(thgema12); p(11)=1/(2*pi)*(det110.5)*exp(-1/2*(a-u11)'/thegema11)*(a-u11); p(12)=1/(2*pi)*(det120.5)*exp(-1/2*(a-u12)'/thgema12)*(a-u12); pz=p(11)*pw1+p(12)*pw2; p11=(p(11)*pw1)/pz;%maleºóÑé¸ÅÂÊ p12=(p(12)*pw2)/pz;%femaleºóÑé¸ÅÂÊ g=p11-p12;%test2Ç°50¸öΪfemale if (g<0)%ÅжÏÊDz»ÊÇfemale female2=female2+1; else error21=error21+1; endend female2 error21 for n=51:number2 a=HW2(:,n); u11=173.9200;65.5020;thegema11=20.7536 23.0582;23.0582 59.8982;%ÄÐÉú u12=162.8400;52.5960;thgema12=43.9344 15.5254;15.5254 31.1285;%Å®Éú det11=det(thegema11);det12=det(thgema12); p(11)=1/(2*pi)*(det110.5)*exp(-1/2*(a-u11)'/thegema11)*(a-u11); p(12)=1/(2*pi)*(det120.5)*exp(-1/2*(a-u12)'/thgema12)*(a-u12); pz=p(11)*pw1+p(12)*pw2; p11=(p(11)*pw1)/pz;%maleºóÑé¸ÅÂÊ p12=(p(12)*pw2)/pz;%femaleºóÑé¸ÅÂÊ g=p11-p12;%test2Ç°50¸öΪfemale if (g>0)%ÅжÏÊDz»ÊÇmale male2=male2+1; else error22=error22+1; endend male2 error22(2) 当身高与体重不相关 u11=173.9200;65.5020;thegema11=20.7536 0;0 59.8982;%ÄÐÉú u12=162.8400;52.5960;thgema12=43.9344 0;0 31.1285;%Å®Éú det11=det(thegema11);det12=det(thgema12);进行替代u11=173.9200;65.5020;thegema11=20.7536 23.0582;23.0582 59.8982;%ÄÐÉú u12=162.8400;52.5960;thgema12=43.9344 15.5254;15.5254 31.1285;%Å®Éú即可(3)(4)基本都类似有源程序代码可以直接运行即可

    注意事项

    本文(用身高与体重数据进行性别分类的实验报告.docx)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开