葡萄酒的评价全国数学建模大赛优秀论文1.doc
《葡萄酒的评价全国数学建模大赛优秀论文1.doc》由会员分享,可在线阅读,更多相关《葡萄酒的评价全国数学建模大赛优秀论文1.doc(28页珍藏版)》请在三一办公上搜索。
1、高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、
2、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 重庆工商大学 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):
3、葡萄酒的评价摘要酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定的程度上反映葡萄酒和葡萄的质量。本论文主要研究葡萄酒的评价、酿酒葡萄的分级以及酿酒葡萄与葡萄酒的理化指标之间的相互关系问题。对于问题一:我们从假设检验的角度出发分析,对两组的评分进行均值和方差运算,并在零假设成立的前提下通过使用Matlab做T检验,得出两组评酒员对于红葡萄酒的评价结果无显著性差异,而对于白葡萄酒的评价结果存在显著性差异的结果。再建立可信度模型,计算结果如下表, 第一组红葡萄酒第二组红葡萄酒第一组白葡萄酒第二组白葡萄酒 0.1005070.056413 0.0649410.041
4、433由表可得第二组的可信度更高。对于问题二:根据葡萄酒质量的综合得分,将其划分为优、良、合格、不合格四个等级,并对酿酒葡萄的理化指标进行主成分分析,得出对葡萄影响较大的理化指标:红葡萄主要理化指标DPPH自由基、葡萄总黄酮、PH值、花色苷、蛋白质、黄酮醇、固酸比、果梗比白葡萄主要理化指标氨基酸、干物质含量、可溶性固形物、果穗质量、总糖、苹果酸、还原糖、总酚、葡萄总黄酮、酒石酸、黄酮醇并根据酿酒葡萄的理化指标和葡萄酒的质量,利用模糊综合评价模型对葡萄酒进行了分类,结果如下: 等级数级数红酒数量红葡指标白酒数量白葡指标次品43103普通311474良好212201916优质11225对于问题三:
5、先对酿酒葡萄的理化指标和酒样品的质量进行偏相关分析,得到了它们的偏相关系矩阵。利用通径方法建立了数学模型,得出了它们之间的线性回归方程:对于问题四:在前面主成分分析和葡萄酒分级的基础上,建立Logistic回归模型,并利用最大似然估计法求出线性回归方程的参数,得出线性回归方程。运用SPSS软件,通过matlab编程运算,求出受它们综合影响的线性回归方程。在验证时,随机从上面选取理化指标,将它们带入P的计算式中,通过所求P值判断此时葡萄酒质量所属级别,得出了不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。最后,对模型进行了改进和推广。关键词 T检验 主成分分析 Logistic回归模型一、
6、问题的重述葡萄酒作为体现时尚品味的元素,同名茶、咖啡一样备受追捧。在物质社会的今天,人们酿造葡萄酒的品质还是有待鉴定的,因此,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。此外,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据,现需要用数学建模方法研究解决以下问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,并判断哪一组
7、结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题的分析针对问题一:分析评酒员的评价结果有无显著性差异,需要从反面来论证,要从假设性检验角度来分析问题。由于样本容量较大,近似地服从正态分布。因此,本论文采用了使用Matlab做T检验,从而确定两组评价有无显著性差异。为了确定哪一组的结果更可信,建立了一种可以替代可信度的模型。又考虑到该样本涉及到的是正态分布,则数据的离散程度是对其影响最大的因素,所以采用用标准
8、差与平均值的比值作为可信度模型来衡量可信度的高低。针对问题二:该问题要求我们根据酿酒葡萄的理化指标和葡萄酒的质量来对酿酒葡萄进行分级,故我们要对酿酒葡萄的理化指标和葡萄酒的质量进行综合评价,但是在进行综合评价以前我们有分别要对它们二者分别进行分析。在第一问中,我们已经对葡萄酒的整体进行了打分,因此,葡萄酒的质量实际上已经分好类了,那么我们就需要对酿酒葡萄的理化指标进行分析。但是,由于影响酿酒葡萄的理化指标的因素有30个,要使问题得到简化,我们只需取其几个主要的影响因素,因此,采用主成分分析法来分析主要影响因素。然而,葡萄酒的质量的单位系与酿酒葡萄的理化指标的单位系不同,因此不能直接加减来判断,
9、所以,我们采用了模糊综合评价模型来对酿酒葡萄进行分级。针对问题三:对酿酒葡萄的理化指标和酒样品的质量进行偏相关分析,得到了它们的偏相关系矩阵。利用通径方法建立了数学模型,得出了它们之间的线性回归方程针对问题四:基于前面主成分分析和葡萄酒分级的基础,建立Logistic回归模型,并利用最大似然估计法求出线性回归方程的参数,得出线性回归方程。运用SPSS软件,通过matlab编程运算,求出受它们综合影响的线性回归方程。在验证时,随机从上面选取理化指标,将它们带入P的计算式中,通过所求P值判断此时葡萄酒质量所属级别,得出了不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。三、基本假设1、各个样品
10、酒中原产地相似,酿酒葡萄的产地对葡萄酒的质量影响相同;2、酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系;3、葡萄酒的酿造工序和贮藏条件相同;4、各评酒员的资质较高,在对葡萄酒品平时都是客观的,不存在主观偏好;5、仪器对样本理化指标和所含芳香物质的测试不存在随机误差,附件所给的数据真实、准确、可靠;6、酒样品容量较大时,认为各组样本服从正态分布且相互独立;7、两种葡萄酒和酿酒葡萄的分级标准相同,且葡萄酒分为优、良、合格、不合格四个级别;8、假设附件1中,酒样品为一级指标,外观、口感、香气分析和整体评价为二级指标,澄清度、色调、纯正度、浓度、持久性和质量为三级指标;四、符号定义:表示澄清度,色调等
11、指标个数,;:表示评酒员的个数,;:表示第b个评酒员对a指标的评分;:表示酒样品数,;:表示第种酒样品评分的均值;:表示总体均值;:表示两组对应红(白)酒的均值差;:表示对均值差()做t检验时的统计量;:表示拒绝域;:表示总体可信度的指标;:表示酿酒葡萄的理化指标数,;:表示第种酒样品的第中理化指标的值;:表示对标准化后的值;:表示相关系数矩阵的第个特征值;:表示主要理化指标的贡献率;:表示主要理化指标的累计贡献率;:表示主要理化指标的综合评价函数,;:表示显著性水平;:表示方差;:表示相关系数矩阵的特征向量;:表示子集中含有个评判因素;:表示个因数的权数分配;五、模型的建立与求解5.1、问题
12、一模型的建立与求解5.1.1显著性差异的T检验针对于如何确定有无显著性差异,我们从假设检验的角度出发,通过使用Matlab做T检验,分析它们的均值与方差来确定显著性。1、对数据均值进行分析计算 均值即每种酒样品的平均得分,它表示每个评酒员对每种酒样品评定的质量的具体值,其公为: , (5.1.1) 其中,a表示附件1中的三级指标;b表示评酒员的个数。将各种葡萄酒样品各个评分代入式子(5.1.1),运用excel计算可得出如下结果:表1 第一组红葡萄酒整体均值酒样品1234567891011121314平均得分62.780.380.468.673.372.271.572.381.574.270.
13、153.974.673酒样品15161718192021222324252627平均得分58.774.979.359.978.679.177.177.285.67869.273.873表2 第二组红葡萄酒整体均值酒样品1234567891011121314平均得分68.17474.671.272.166.365.36678.268.861.668.368.872.6酒样品15161718192021222324252627平均得分65.769.974.565.472.675.872.271.677.171.568.27271.5表3 第一组白葡萄酒整体均值酒样品1234567891011121
14、314平均得分8274.278.379.47168.477.570.472.974.372.363.365.972酒样品1516171819202122232425262728品均得分72.47478.873.172.277.876.47175.973.377.181.364.881.3表4 第二组白葡萄整体均值酒样品1234567891011121314平均得分77.975.875.676.981.575.574.272.380.479.871.472.473.977.1酒样品1516171819202122232425262728平均得分78.467.380.376.776.476.679
15、.279.477.476.179.574.37779.62、对数据方差进行分析计算 方差即各个数据与平均数之差的平方的平均数,它表示两组葡萄酒质量的波动大小,其公为: , (5.1.2) 其中,m表示酒样品数;表示组数,=1,2.将以上各种葡萄酒样品的均值代入式子(5.1.2),可求得各组的方差,结果如下:表5 两组红、白葡萄酒的方差第一组红葡萄酒第一组白葡萄酒第二组红葡萄酒第二组白葡萄酒53.9141025623.3078703715.8243910.054853、成对数据进行T检验根据表1、表2、表3和表4显示的结果,我们可将两组中红、白酒样品分别形成相应的成对数据,形式如下表:表6 两组
16、酒样品的成对数据及差值酒样品号1227x1x2x27y1y2y27x-y(d)d1d2d27首先,假设:,且独立,则,其中,;然后,T检验问题为: 零假设 ,即; 对立假设,即.此时,用T统计量 , (5.1.3)其中, ,表示酒样品数,(红酒,白酒);在零假设成立的前提下,此统计量服从分布。这时,零假设的()显著水平的拒绝域是如下的样本区域: . (5.1.4)将表1和表2中的数据代入式子(5.1.3)中,可求得红葡萄酒的统计量t值,通过查表法将m值代入(5.1.4)可以求得显著水平的拒绝域。结果为:=2.04569 =2.04106所以可得评酒员对红葡萄酒的评价没有显著性差异。同理,我们可
17、计算出白葡萄酒的统计量t值,即=-2.66648,不在拒绝域内,所以,结果可得两组评酒员对白葡萄酒的评价存在显著性差异。5.1.2可信度模型的建立及求解针对可信度的问题,我们用H表示可信度。在一定程度上,当平均值相等时,标准差能反映一个总体的离散程度,即标准差越大,离散程度越大,则表明这个总体的水平不稳定;标准差越小,反之水平越稳定。基于标准差和平均值的性质,我们用标准差与平均值比值的大小来表示一个总体可信度的高低。因而,我们建立一个可信度模型:,其中,H表示标准差与平均值的比值,即.可见,H值越大时它的可信度越低,H值越小时可信度越高。由此,可算得两组红葡萄酒样本的标准差与平均值的比值,如下
18、表:表7 两组红、白葡萄酒的均值标准差与平均值的比值第一组红葡萄酒第二组红葡萄酒第一组白葡萄酒第二组白葡萄酒 0.1005070.056413 0.0649410.041433由以上表格显示的结果可得出如下结论:对于两组中的红葡萄酒,有:,所以第二组对红葡萄酒的评价结果的可信度更高;对于两组中的白葡萄酒,有:,所以第二组对白葡萄酒的评价结果的可信度更高;综上所述:第二组更可信。5.2、问题二模型的建立和求解5.2.1对酿酒葡萄的质量进行分类该问题要求我们根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,而在第一问中我们已经对葡萄酒进行了综合评分,现将其结果分为优、良、合格、不合格四类
19、,。对其质量进行等级分类,结果如下表格:表8 红葡萄酒质量的等级分类等级(均值)酒样品优(75以上)9、20、23良(7075)2、3、4、5、14、17、19、21、22、24、26、27合格(6570)1、6、7、8、10、12、13、15、16、18、25不合格(65以下)11 表9 白葡萄酒质量的等级分类等级(均值)酒样品优质(75以上)1、2、3、4、5、6、9、10、14、15、18、19、20、21、22、23、24、25、26、27、28良 (7075)7、8、11、12、13合格(6570)16不合格(65以下)5.2.2对酿酒葡萄的理化指标进行主成分分析1、建立主成分分析数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 葡萄酒 评价 全国 数学 建模 大赛 优秀论文
链接地址:https://www.31ppt.com/p-4063581.html