数学建模A题答辩.ppt
尊敬的各位评委老师,同学们,大家好!,多元统计分析在葡萄酒评价中的应用,昆明学院,本文在葡萄酒评价中针对多组指标的多组数据,在数据处理上应用了标准化处理、主成分分析等多重方法,应用了多元统计分析中的方差分析、聚类分析、回归模型中的趋势面分析等多种方法对葡萄酒进行评价。,主要内容:一 问题的理解与分析 二 模型的建立与求解 三 模型的评价,一 问题的理解与分析,问题一 要求是对两组评酒员的评价结果有无显著性差异进行分析,并判断哪一组的结果更可信。我们建立单因素方差分析模型,经过求解,假设与检验,计算得到结果来分析这两组评酒员的评价结果有无显著性差异,然后又经过比较两组评酒员所打分数的平均值与方差,来比较哪组结果更可信。,问题二 我们首先用葡萄酒中的芳香物质来定量分析葡萄酒的质量,对数据进行无量纲化以及主成分分析法进行处理,然后对每一个酿酒葡萄及葡萄酒样本进行相对性的综合评分,最后用这两组数据进行二维的聚类分析来对酿酒葡萄进行分级。,问题三 我们对于分析酿酒葡萄与葡萄酒的理化指标之间的联系这一问题,通过分析酿酒葡萄与葡萄酒之间相对应的理化指标,以及它们之间的协方差和相关系数确定出了酿酒葡萄与葡萄酒的理化指标之间的相关关系。,问题四 我们利用问题二中算出的数据,以及问题二中的方法来计算葡萄酒相应于其理化指标的综合得分,然后用酿酒葡萄相应于其理化指标的得分,葡萄酒质量相应于所含芳香物质的得分,以及葡萄酒相应于其理化指标的得分这三组数据进行趋势面分析得到拟和的曲面图以及酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响函数关系式,最后用 检验法得出红酒和白酒可否认为能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。,二 模型的建立与求解,问题一 对于分析两组评酒员的评价结果有无显著性差异这一问题,由于两组评酒员在评分上有差异,因此分别计算红、白葡萄酒中每一个品酒员对所有样品打分的平均值作为影响因素,并且设各正态总体具有相同的方差。建立了如下单因素方差分析模型:,下面经过显著性检验假设(取显著性水平),利用附件1中所给数据经过无量纲化处理之后,并且所有的 均减去,用Excell辅助求解得到如下方差分析表:,红葡萄酒,白葡萄酒,根据模型的结果有,F值均小于临界值,因此接受假设,即这两组评酒员的评价结果无显著差异。,又计算出两组评酒员所打分数的平均值及方差如下:,综合两组评酒员所打分数的平均值及方差,因为第二组的方差更小,也就是该组专家的意见相对更一致,所以说第二组评酒员的结果更可信。,问题二,本问题中涉及了葡萄酒的质量,我们通过查阅文献(葡萄酒芳香物质研究进展)得到芳香物质对葡萄酒的质量有重要的影响,所以用葡萄酒中的芳香物质来定量的分析葡萄酒的质量。对于酿酒葡萄的理化指标,它分为一级、二级等多级指标。它的指标都是检测了三次,所以我们对其求平均值并以此作为指标的数值。而二级指标中除了H、C两个二级指标外其余的每一类二级指标的和都等于所对应的一级指标值,所以我们不考虑二级指标(除H、C)。,首先我们对所有的数值用标准化变换进行无量纲化处理,由于葡萄酒中的芳香物质及酿酒葡萄中的理化指标很多,就需要把这些很复杂的数据集简化,因此我们应用主成分分析法在DPS软件中分别对它们进行主成分分析,找出几个综合因子来代表原来众多的变量。分析结果(1),分析结果出来后,一般建议是取当特征值累积贡献率达80%,或者特征值大于1时的主成分个数。我们根据特征值大于1时的主成分个数对葡萄酒中的芳香物质及酿酒葡萄中的理化指标取得主成分(2)。,在主成分分析结果出来后,我们将前 个特征值较大的主成分,按照公式:计算个主成分的“综合值”,每一个酿酒葡萄及葡萄酒样本都对应一个“综合值”,而这个“综合值”充分利用了所有的信息,于是这个“综合值”就能用来作为每一个酿酒葡萄及葡萄酒样本相对性的综合得分。在DPS中计算可得每一个酿酒葡萄及葡萄酒样本的得分(3)。,表中酿酒葡萄的得分依赖于它的理化指标,这个得分能相应的定量反映出理化指标的信息;同样葡萄酒的得分依赖于它的芳香物质,而芳香物质又决定了葡萄酒的质量,所以这个得分就能定量的反映出葡萄酒质量的信息。因此用每个酿酒葡萄样本的综合得分和葡萄酒质量的综合得分,分为两组变量,并对这两组变量进行二维的聚类(在DPS中实现),分析得出红葡萄和白葡萄的聚类结果图如下:,(红葡萄),(白葡萄),最后根据聚类结果图可以对红、白葡萄进行如下分级:,(红葡萄),(白葡萄),问题三 对于分析酿酒葡萄与葡萄酒的理化指标之间的联系这一问题,我们观察附件3所给数据,选择了花色苷、单宁、总酚、酒(葡萄)总黄酮、白藜芦醇、DPPH半抑制体积、色泽(L*(D65、a*(D65)、b*(D65)、H(D65)、C(D65)这些对应的理化指标为研究对象,建立了下述两个简单的模型,分别用协方差及相关系数对酿酒葡萄与葡萄酒的理化指标之间的联系进行了简单分析。,建立了如下模型:,其中 是期望值,是相应理化指标值的平均值。,用Excell辅助求解,结果如下:,问题四 我们充分利用模型二中的方法应用DPS数据处理软件得出葡萄酒中理化指标的主成分分析结果(见附件1),主成分如下:,再利用模型二中的综合打分法得到红、白葡萄酒每个样本的具体得分(4)。这个得分能定量的反映出其理化指标的信息,也就能用来分析每个葡萄酒样本的理化指标。,表16,再利用模型二中的酿酒葡萄相应于其理化指标的得分以及葡萄酒质量相应于所含芳香物质的得分,以及葡萄酒相应于其理化指标的得分。把这三组数据分为(葡萄酒质量相应于所含芳香物质的各个样品得分)、(酿酒葡萄相应于其理化指标的各个样品得分)、(葡萄酒相应于其理化指标的各个样品得分),用回归分析中的趋势面分析(在DPS中实现)分别得出红、白葡萄酒的曲面拟合图如下:,进一步得出酿酒红葡萄和红葡萄酒的理化指标对红葡萄酒质量的影响函数关系式:,酿酒白葡萄和白葡萄酒的理化指标对白葡萄酒质量的影响函数关系式:,势面的适度问题关系到趋势面分析的应用效果,从统计学观点来看,趋势面拟合程度的高低是回归效果好坏的关键。我们用 检验来检验趋势面的适度(在DPS中实现),结果如下:,分析该表可得出红酒的残差标准差很小,说明数据可靠,而拟合度相当高说明应用效果高,而白酒的相对于红酒的有一小点差异,应用效果没有红酒的高,但是它的应用效果也是相当可行的。,综合红酒和白酒的 检验结果可以认为能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。,三 模型的评价,模型一:优点:对于单因素方差分析模型而言,该模型较好的排除了随机因素的影响,公平合理的对两组评酒员的结果进行了评价。模型二:优点:本模型中我们对多指标进行了集简化,不考虑二级指标只对一级指标进行分析、对数据进行无量纲化处理、对指标进行主成分分析,这些处理数据的方法简化了我们的运算,更利于我们的分析。在进行分级时应用了聚类分析法处理,结果可以图形化,更清晰明了。,缺点:在实际中可能有一些二级指标不能忽略,所以忽略了可能会造成一定的误差。模型三:优点:应用单一变量逐个分析,更能体现其中的相关性。模型四:优点:趋势面分析拟合回归模型针对二维变量拟合度较高,结果能达到足够的准确性。检验法简洁明了,实用性很强。,谢 谢 大 家!,谢 谢 大 家!,