haihongyuan.com
海量文库 文档专家
全站搜索:
您现在的位置:首页 > 初中教育 > 学科竞赛学科竞赛

2012年数学建模竞赛A题论文

发布时间:2013-09-26 11:14:12  

2012高教社杯全国大学生数学建模竞赛

承 诺 书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 指导教师或指导教师组负责人 (打印并签名):

日期: 年 月 日

赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛

编 号 专 用 页

赛区评阅编号(由赛区组委会评阅前进行编号):

全国统一编号(由赛区组委会送交全国前编号):

全国评阅编号(由全国组委会评阅前进行编号):

题目:葡萄酒评价

摘要

在对葡萄酒的评价中一般是通过聘请一批有资质的评酒员进行品评,根据感官得分来确定葡萄酒的质量,现在结合对葡萄和葡萄酒的理化指标来对葡萄酒质量进行评价。

对于问题一:首先,对每一样品酒的评价得分进行均值处理,并对每一样品酒的均值得分作可靠性检验,在检验可行的基础上建立比较模型,可靠性检验两组样品酒得分Cronbach’Alpha值a?0.6,则样品酒均值得分可信,然后,对两组样品酒进行方差分析,方差显著性0.073?0.05,因此两组的评价结果无显著性差异,对两组样品酒得分作变异系数分析,最后,结果显示第二组的变异系数波动幅度小,较稳定。

对于问题二:首先,利用极值差法对葡萄理化指标数据进行标准化处理,其次,我们用主成分分析法对标准化后的葡萄理化指标作因子分析,运用matlab计算主成分因子得分,建立分级模型。然后,在问题一的基础上,将两组葡萄酒因子综合得分作为葡萄分级的因变量之一。最后,我们将综合因子得分和感官平均得分作为两个因变量运用Spss统计软件进行聚类分析,得到酿酒葡萄的类别,根据感官得分高低进行分级处理。部分结果如下,以红葡萄样品为例(括号内数值表示样品酒标号),第一等级(9,,23,20),第二等级(3,17,2,14,19,21,5,26,22,24,27,4),第三等级(16,10,13,12,25,1),第四等级(6,8,15,18,7),第五等级(11)

对于问题三,首先,利用极差值法对葡萄酒的理化指标进行数据预处理,其次,我们利用MATLAB编程对酿酒葡萄和葡萄酒的理化指标进行典型相关分析,建立典型相关分析模型,运用Spss求解,最终,得到酿酒葡萄与葡萄酒的品质的典型相关系数R2?0.9231(红葡萄的典型相关系数) R1?0.7924(白葡萄的典型相关系数)说明

两者联系紧密。

对于问题四,首先,我们将酿酒葡萄和葡萄酒的芳香物质进行因子分析,然后,运用多元二项式回归分析方法,建立多元二项式回归分析模型,;其次,针对葡萄酒质量的评价,我们用酿酒葡萄和葡萄酒的理化指标的主成份得分,在第二问的基础上用葡萄酒的等级排序,再加入酿酒葡萄和葡萄酒的芳香物质指标,最后,以四项指标的主成份得分再次进行主成份排序比较。得到结论:不能仅依靠酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

关键词 :葡萄酒 SPSS 极差值法 典型相关分析 多元二项式回归

1

问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:

1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

问题分析

对于问题一:我们要找出两组评酒员结果有无差异性,并得出哪一组结果更可信。因为在对葡萄酒评酒中,人们大多以评酒员的感官得分作为依据,评酒员打分具有很大的主观成分,在一定程度上容易造成葡萄酒得分的失真。因此,为防止葡萄酒得分失真问题的出现,我们对附件1中的2组葡萄酒的评价数据进行可靠性分析。首先,我们对两组评酒员对同一红酒的各项感官得分进行综合汇总得出各评酒员对同一样品酒的综合得分,并求解出每个样品酒的得分平均值,其次,对两组葡萄酒得分进行可靠性检验,检验结果显示可靠性高,并且在数据可靠性的前提下,最后,对两组样品酒数据做变异系数,变异系数反映单位均值上的离散程度,组内数据变异数据越平稳,表示该组数据越稳定,该组样品酒的可信度越高。

对于问题二:我们要根据酿酒葡萄的理化指标和葡萄的质量对酿酒葡萄进行分级,由于葡萄理化指标很多因此运用极值差法对葡萄理化指标进行标准化统一量纲。首先,我们用主成分分析法对标准化后的葡萄理化指标作因子分析,找出影响葡萄质量的主成分理化指标。计算得出主成分因子指标后将每个主成分因子占所有主成分因子的百分比作为主成分因子的权重运用Spss计算得出主成分因子总得分。其次,在问题一的基础上,得到红白葡萄酒的感官平均得分。最后,我们将主成分因子总得分和感官平均得分作为两个因变量运用Spss统计软件进行聚类分析,得到酿酒葡萄的类别。然后再根据感官得分高低进行分级处理。

对于问题三,我们同样首先把数据进行标准化处理,其次,将数据用MATLAB进行

2

典型相关分析建立典型相关分析模型,得出酿酒葡萄的理化指标和葡萄酒的理化指标之间的内在联系,最后,将酿酒葡萄理化指标和葡萄酒理化指标两组变量作线性关系组合用来得到其的典型相关系数,以用来分析酿酒葡萄和葡萄酒理化指标的联系。

对于问题四,为了考虑酿酒葡萄和葡萄酒理化指标对葡萄酒质量的影响,我们将葡萄和葡萄酒的芳香物质带入计算,首先,运用因子分析对以上四种指标用MTALAB进行主成分得分计算,然后,将四种葡萄和葡萄酒的理化指标和芳香物质指标因素作为自变量,葡萄酒评分作为因变量进行多元交叉回归分析建立多元交叉回归分析模型,然后,得到以上四种因素哪一种对葡萄酒的影响最大;为了考虑能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,我们先按照问题2得出的葡萄酒分级,将葡萄酒分为5类进行讨论,在每一级的分类中以酿酒葡萄和葡萄酒所有的指标进行因子分析,以因子总分进行排序,再与问题2中得到的葡萄酒质量排序进行比较,若波动不大则暂时认为能用酿酒葡萄和葡萄酒的理化指标对葡萄酒的质量进行评价,然后我们再在因子分析时加入葡萄和葡萄酒的芳香物质,以此时的到的因子总分再排序,与之前的排序做比较,若偏差不大,则认为酿酒葡萄和葡萄酒的理化指标能够对葡萄酒的质量进行评价,反之则不能。

符号说明

符号

Xn Yn Un Vn

a b c

d

含义说明

酿酒葡萄各理化指标

葡萄酒中各理化指标 X中的第n个典型变量 Y中的第n个典型变量 典型相关系数

葡萄酒理化指标因子得分 酿酒葡萄理化指标因子得分 葡萄酒芳香物质因子得分 酿酒葡萄芳香物质因子得分 葡萄酒评分

R

d e

模型建立及求解

模型一:

Step1:对原始数据(见附表)进行处理得出各组葡萄酒的平均得分如下表1

3

红葡萄酒一组 评分均值 63.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3 81.5 74.2 70.1 53.9 74.6 73 58.7 74.9 79.3 59.9 78.6 79.2 77.1 77.2 85.6 78 68.2 73.8 73

表一

红葡萄二组 评分均值 68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6 68.3 68.8 72.6 65.7 69.9 74.5 65.4 72.6 76.8 72.2 71.6 77.1 71.5 68.2 72 71.5

白葡萄一组 评分均值 82 74.2 78.3 79.4 71 68.4 77.5 71.4 72.9 74.3 72.3 63.3 65.9 72 72.4 74 78.8 73.1 72.2 77.8 76.4 71 75.9 73.3 77.1 81.3 64.8 81.3 白葡萄二组 评分均值 77.9 75.8 75.6 76.9 81.5 75.5 74.2 72.3 80.4 79.8 71.4 72.4 73.9 77.1 78.4 67.3 80.3 76.7 76.4 76.6 79.2 79.4 77.4 76.1 79.5 74.3 77 79.6

Step2:用Spss对以上的均值数据进行可靠性检验

4

Cronbach’较高。以上四组a值均大于0.6,因此可以基于可靠数据从而对数据进行标准差和方差运算,方差能反映出数据的稳定程度,但受到均值的影响,所以引入变异系数用变异系数稳定性来测度各组评酒人员的评价结果的可信度。 Step3:方差分析

对两组评酒员评分的差异显著性分析

由于,两组数据在组内对比时显著性为0.073大于0.05的假设,所以两组评酒员的评价结果没有显著性差异。

5

Step4:变异差异系数

红葡萄酒一组 红葡萄酒二组 白葡萄酒一组 白葡萄酒二组 0.174506 0.132873 0.117113 0.061951

0.078553 0.054428 0.191102 0.087669

0.084194 0.074286 0.104113 0.149792

0.151522 0.090248 0.084215 0.080045

0.107431 0.051253 0.158377 0.05967

0.107046 0.06932 0.186489 0.059896

0.142363 0.121239 0.080753 0.083035

0.091758 0.12226 0.189775 0.073201

0.070426 0.06487 0.13212 0.121636

0.074308 0.087424 0.196278 0.099748

0.120004 0.10013 0.184076 0.124516

0.165584 0.073385 0.169992 0.155066

0.089856 0.056833 0.198297 0.08779

0.082192 0.066281 0.148437 0.04903

0.157585 0.097869 0.158449 0.088957

0.056801 0.064139 0.180293 0.127829

0.118303 0.04064 0.152378 0.073263

0.114708 0.108408 0.17116 0.068009

0.087572 0.102296 0.094346 0.06337

0.049727 0.105031 0.103149 0.087613

0.139753 0.082536 0.172015 0.096126

0.092162 0.068801 0.165855 0.087475

0.066588 0.064547 0.087052 0.041745

0.110947 0.045797 0.143812 0.077396

0.102009 0.096967 0.075492 0.123148

0.075795 0.089533 0.10502 0.129521

0.096648 0.063324 0.185442 0.073466

0.110328 0.060039

Step4:由上表可知,两组评酒员的评价结果并无显著性差异,红葡萄酒二组,白葡萄酒二组的变异系数较稳定,因此红葡萄酒和白葡萄酒二组结果更可信。

模型二:

Step1:数据标准化

假设m个 评价标准x1,x2,…,xm,并且假设进行了同类型的一致化处理,并都有n组样本观测xij(i=1,2,…,n;j=1,2,…,m),则将其作无量纲化处理。 xij?mj?令xij??i?1,2,3,...,n;j?1,2,3,...,m?其中Mj?mj

Mj?max?xij?,mj?min

1?i?n?xij??j?1,2,...,m? 1?i?n

6

???0,1?是无量纲指标. 则xij

Step2:对标准化后的数据作因子分析

对红酿酒葡萄做因子分析

从因子分析输出的解释的总方差(见附录)和碎石图分布可以看出前8个因子的贡献率达到了83.004%,符合主成分的贡献要求,8个因子分别为酚类主成分因子,干物质主成分因子,醇类主成分因子,酸碱度主成分因子,果穗质量主成分因子,色泽主成分因子,果皮质量主成分因子,糖类主成分因子。用成分得分矩阵和每个主成分因子占所有主成分因子的百分比所求的的权重用Excel作乘积得到主成分总得分如下表2

7

Step3:

我们在问题一的基础上得到酿酒红葡萄的感官得分如下:

8

酿酒红葡萄感官平均得分散点图

80

78

76

74

72

70

68

66

64

62

60051015202530

Step4:聚类分级

将主成分因子总得分和感官平均得分作为两个因变量运用Spss统计软件进行聚类分析,得到红酿酒葡萄的分级

红酿酒葡萄聚类树状图

Dendrogram using Average Linkage (Between Groups)

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+

葡萄样品10 10 -+

葡萄样品13 13 -+-+

葡萄样品12 12 -+ |

葡萄样品25 25 -+ +-----+

葡萄样品1 1 -+ | |

葡萄样品16 16 ---+ +-----------------------+

葡萄样品6 6 -+ | |

葡萄样品8 8 -+-------+ |

葡萄样品7 7 -+ +---------------+

9

葡萄样品18 18 -+ | | 葡萄样品15 15 -+ | | 葡萄样品11 11 ---------------------------------+ | 葡萄样品20 20 -+ | 葡萄样品23 23 -+---------------------+ | 葡萄样品9 9 -+ | | 葡萄样品3 3 -+ +-------------------------+ 葡萄样品17 17 -+---+ |

葡萄样品2 2 -+ | |

葡萄样品22 22 -+ +-----------------+

葡萄样品24 24 -+ |

葡萄样品27 27 -+ |

葡萄样品4 4 -+---+

葡萄样品14 14 -+

葡萄样品19 19 -+

葡萄样品5 5 -+

葡萄样品26 26 -+

葡萄样品21 21 -+

我们根据我国葡萄酒等级划分的标准我们将酿酒红葡萄运用聚类分析聚成5类,并且在聚成5类的基础上以感官高低得分作为葡萄样品等级分成的标准,得到酿酒红葡萄的等级划分表,如下:

酿酒红葡萄样品等级表

等级

第一等级 红葡萄样品 9,23,20

第二等级 3,17,2,14,19,21,5,26,22,24,27,4

第三等级

第四等级

第五等级 16,10,13,12,25,1 6,8,15,18,7 11

白酿酒葡萄同理可得:

我们在问题一的基础上得到酿酒白葡萄的感官得分如下:

10

白葡萄感官平均得分散点图

82

80

78

76

74

72

70

68

66051015202530

白葡萄聚类树状图

Dendrogram using Average Linkage (Between Groups)

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+

葡萄样品3 3 -+

葡萄样品6 6 -+

葡萄样品2 2 -+

葡萄样品24 24 -+

葡萄样品18 18 -+---+

11

葡萄样品20 20 -+ |

葡萄样品19 19 -+ |

葡萄样品4 4 -+ |

葡萄样品27 27 -+ |

葡萄样品14 14 -+ |

葡萄样品23 23 -+ +---------+

葡萄样品1 1 -+ | |

葡萄样品15 15 -+-+ | |

葡萄样品9 9 -+ | | |

葡萄样品17 21 -+ | | |

葡萄样品22 22 -+ +-+ +---------------------------------+ 葡萄样品25 25 -+ | | | 葡萄样品28 28 -+ | | | 葡萄样品10 10 -+ | | | 葡萄样品5 5 ---+ | | 葡萄样品7 7 -+ | | 葡萄样品26 26 -+-+ | | 葡萄样品13 13 -+ +-----------+ | 葡萄样品8 8 -+ | | 葡萄样品12 12 -+-+ | 葡萄样品11 11 -+ | 葡萄样品16 16 -------------------------------------------------+

我们根据我国葡萄酒等级划分的标准我们将酿酒白葡萄运用聚类分析聚成5类,并且在聚成5类的基础上以感官高低得分作为葡萄样品等级分成的标准,得到酿酒红葡萄的等级划分表,如下:

酿酒白葡萄等级表

等级

第一等级 白葡萄样品 5

第二等级 9,17,10,28,25,22,21,15,1

23,14,27,4,18,20,19,24,2,3,6 第三等级

第四等级

第五等级 26,7,13,12,8,11 16

模型三:典型相关分析模型

由于总体的均值向量和总体协方差矩阵往往都是未知的,这就需要从总体中随机抽取一个样本,根据样本资料对总体的均值向量和总体的协方差矩阵进行估计,进而求出

12

样本典型相关变量及其典型相关系数

Step1:典型相关系数的检验。

首先应检验两组变量是否相关,若两组不相关,即Cov(x,y)?0?p?r?1??q?r?1?若Cov(x,y)?0则典型相关分析就有意义。典型相关系数显著性检验,主要采用的是巴特莱特(Bzrtlett)关于大样本的?2检验。?1

?2???2?...???2?0,这时作乘积: 对于矩阵A的P特征值,按照大小排列为?12p

?2)?1???21???2...1???2, ?1??(1??i12pp

其中?i2是A??22?21?11?12的特征根。

对于当n充分大了,H0成立时,统计量

1??Q1???n?1??p?q?1??ln?1 2??

近似服从p?q个自由度的?2的分布,若在给定的显著性水平?下,Q1??2?p*q?,?1i?1?1??????则拒绝原假设H0,则至少可以认为第一对变量具有相关性,相关系数为?1,第一个典

型相关系数?1为显著。

一般地,当检验第k个典型相关系数的显著性时,应用的检验统计量为:

1??Qk???n?k?1??p?q?1??ln?k 2??

其中,

p??2??k???1???i? ??i?k?1

Qr近似服从?2分布,自由度为fk??p?k??q?k?

12Spss会自动计算X??,X??k?1至r的上述卡方统计量以及对应的k值。如果p值小

于给定的显著性水平?,则拒绝原假设,认为第k个典型相关系数显著;如果p值大于给定的显著性水平?,则无法拒绝原假设,认为从第k个开始往后的所有典型性相关系数均不显著,对典型相关系数进行检验。特征值与典型相关系数的关系是:

特征值=(典型相关系数2)/(1-典型相关系数2)。

由该检验认为,只有第一个典型相关系数在0.1的水平上市显著的。多元统计检验的结果显示,Hotelling迹和Roy’s gcr在0.05的显著性水平上是显著的。

R在0.05的显著水平上,认为典型根是显著的

Step2:典型相关分析

典型相关分析的基本思想和主成分分析非常相似。首先在每组变量中找出变量的一个线性组合,使得两组的线性组合之间具有最大的相关系数。然后选取相关系数仅次于第一对线性组合并且与第一对线性组合不相关的第二对线性组合,如此继续下去,直到两组变量之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。典型相关系数度量了这两组变量之间联系的强度。

11122?1??2??2?,...X?

p?,X???X1??,X2,...Xq设X???X1??,X2 ????

是两个相互关联的随机变量,分别在两组变量中选取若干代表性的综合变量Ui,Vi,

13

使得每一个综合变量是原变量的线性组合,即

i1i11?i??1?

Ui?a1??X1???a2X2?...?a?p?X?p??aiX??

????????Vi?b1??X1???b2X2?...?bqXq?biX??

i

2

i

2

i

2

2

为了确保典型变量的唯一性,我们只考虑方差为1的X?1?,X?2?的线性函数

a??X??,b??X??,求使得它们相关系数达到最大的这一组。若存在常向量,a??,b??,在

i

1

i

2

1

1

Da??X???Db??X?

1

1

1

???

2?

??1的条件下,使得相关系数??a??X??,b??X???到最大,则称

1

1

1

2

a??X??,b??X??是X?1?,X?2?的第一对典型相关变量,它们之间的相关系数就叫典型相关系数

即:对酿酒红葡萄和红葡萄酒

U1?0.113x1?0.1236x2?0.2541x3?...?0.1247x28?0.0851x29?0.025x30

1

1

1

2

V1?0.1819y1?0.0445y2?0.0669y3?...?0.0518y7?0.0756y8?0.0756y9 R1?0.7924

U2??0.013x1?0.2822x2?0.1912x3?...?0.1051x28?0.1341x29?0.0169x30 V2?0.1603y1?0.0167y2?0.2487y3?...?0.0576y7?0.0437y8?0.1034y9

R2?0.6

对酿酒白葡萄和白葡萄酒

U1?0.211x1?0.02x2?0.36x3?...?0.1884x27?0.0652x28?0.3708x29

V1?0.186y1?0.0978y2?0.0266y3?...?0.0284y27?0.4087y28?0.053y29

R?0.9231

U2??0.0274x1?0.0545x2?0.3168x3?...?0.0133x27?0.0256x28?0.4462x29 V2?0.059y1?0.0894y2?0.0159y3?...?0.4513y27?0.023y28?0.1347y29

R?0.2862

求出第一对典型相关变量之后,可以类似的求出各对之间互不相关的第二对典型相

12

关变量、第三对典型相关变量、……。这些典型相关变量就反映了X??,X??,之间的线性相关情况。我们可以通过检验各对典型相关变量相关系数的显著性,来反映每一对综合变量的代表性,如果某一对的相关程度不显著,那么这对变量就不具有代表性,不具有代表性的变量就可以忽略。从上式可以看出酿酒红葡萄和红葡萄酒中第一对典型相关系数R2?0.9231R1?0.7924表示典型相关系数显著,酿酒白葡萄和白葡萄酒中第一对典

型相关系数R2?0.9231表示典型相关系数显著。

模型四:多元二项式交叉回归模型

Step1:因子分析

我们运用matlab对葡萄的理化指标、芳香物质和葡萄酒的理化指标、芳香物质以上4个主成分作因子分析,计算求得四个主成分的因子得分如下

葡萄酒理化指标 葡萄理化指标 葡萄酒芳香物质 葡萄芳香物质

0.4504 0.5255 0.3036 0.0121

14

0.6212 0.4773 0.5733 0.49 0.2662 0.2303 0.2984 0.4271 0.2586 0.3721 0.1165 0.2487 0.5008 0.5009 0.6088 0.4715 0.1055 0.1989 -0.0597 0.339 0.1858 0.3681 0.1938 0.2719 0.279 0.4113 0.0606 0.3078 0.1058 0.2802 0.329 0.4677 0.1193 0.3003 0.2959 0.3089 0.0457 0.3263 0.5619 0.3042 0.329 0.3382 0.8043 0.5275 0.2589 0.3824 0.1382 0.1954 0.1626 0.3074 0.1489 0.2422

Step2:多元二项式回归

多元二项式回归的交叉回归模型为

j?1

0.1594 0.1685 0.2015 0.2224 0.2062 0.1164 0.1856 0.1497 0.1907 0.3063 0.1909 0.1638 0.1782 0.1569 0.2203 0.2212 0.1462 0.1274 0.1472 0.1912 0.3166 0.2953 0.2481 0.1158 0.1776 0.5788 0.1028 0.082 0.0506 0.0551 0.0854 0.0463 0.1031 0.1267 0.0561 0.2975 0.518 0.1528 0.0125 0.0517 0.0453 0.027 0.0549 0.0588 0.1744 0.2287 0.0772 0.05 0.0474 0.0768 0.0949 0.4015

y??0??1x1?...??mxm???jkxjxky??0??1x1?...??mxm???jkxjxk

j?1

以以上四项指标为自变量,红葡萄酒评分作为因变量做多元二项式回归中的交叉回归,得到回归方程:

e?20.1023?1.778ab?141.9935ac?198.0525ad?233.044bc?9.1039bd?120.2086cd 得到剩余残差值

rmse?3.0572

拟合效果良好。

即得到酿酒葡萄以及葡萄酒理化指标对葡萄酒评价的影响方程。

同理可求得白葡萄酒的影响方程。 Step3:

首先对红葡萄酒进行计算,对红葡萄酒中酿酒葡萄和葡萄酒的理化指标进行汇总,在对这些理化指标进行主成分分析,通过对各因子得分进行权重计算得到总的主成份得分,把第二个问得到的结果作为葡萄酒标准的等级分类,对每个等级对应的样品的主成

15

分得分进行排序,和标准分类的顺序进行比较,看差异是否显著,即看正常率是否大于90%(正常:样品经过主成分分析后每个等级的位置顺序与标准位置的顺序的差距小于等于三是为正常,我们看作是在误差范围内),得到的正常率约为92.59%。

然后把酿酒葡萄和葡萄酒的芳香物质的数据代入酿酒葡萄和葡萄酒的理化指标汇77.78%。

16

同理可得白葡萄酒排序的正常率为75%。所以我们得到的结论是不能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。通过查阅了相关资料,我们知道酿酒技术、营养成分、矿质元素、发酵的菌种等都会影响葡萄酒的质量。

模型评价

1、模型数据较准确,在建立模型之前,首先对数据进行了可靠性检验和标准化,这样就排除了由于数据本身所产生的误差,使得数据更可靠。 2、该模型适用于大量数据的处理。 3. 在整个模型的运行过程中,都是用标准化数据对数据进行统计分析,有利于各种指标之间进行比较,能较好地反映个指标之间的关系。 4. 用主成份分析的方法对指标进行简化,使大量的数据变得更简洁,更利于我们的模型计算。 5. 用典型相关模型对问题进行分析,找出最典型的相关元素,在对各不相关的元素进

17

行分析,能更好地反映各个成分之间的关系。

6. 用主成分分析会导致许多的因素合并,不能表现出数据中很多微量元素的性质,不能更好地对目标变量进行综合评价。

参考文献

[1] 张丽芝 贺兰山东麓红葡萄酒等级划分客观标准的初步研究 《中国食物与营养》 29-32页 2012年第18期

[2] 李运 李记明 姜中军 统计分析在葡萄酒评价中的运用 《酿酒科技》 2009年第4期

[3] 李华 刘曙东 王华 张子林 葡萄酒感官评价结果的统计分析方法研究 《中国食品学报》 2006年4月第6卷第2期

[4] 薛红 大豆多个数量性状的典型性相关分析 《黑龙江农业科学》22-24页 2012年10月

[5]王金甲 尹涛 李静 洪文学 马崇霄 基于物理化学性质的葡萄酒质量的可视化评价研究 《燕山大学学报》 2010年3月第34卷第2期

[6] 李记明 李华 葡萄酒成分分析与质量研究 《食品与发酵工业》 30-35页 1994年第2期

[7] 李记明 关于葡萄品质的评价指标 《中外葡萄与葡萄酒》 55-57页 1999年第1期

18

附录

酿酒红葡萄:解释的总方差

19

红葡萄酒第一组感官得分

红葡萄酒第二组感官得分

20

白葡萄酒第一组感官总分

21

白葡萄酒第二组感官总分

22

问题3MATLAB程序:

x=[]; y=[]'; z=[x y];

X=zscore(x); Y=zscore(y); Z=zscore(z);

disp ('计算矩阵A和B') V11=cov(X); V12=cov(Z); V22=cov(Y); V21=V12';

A=inv(V11)*V12*inv(V22)*V21 B=inv(V22)*V21*inv(V11)*V12 disp ('矩阵A的特征向量和特征值') [U_A,D_A]=eig(A)

disp ('矩阵B的特征向量和特征值') [U_B,D_B]=eig(B) D_A(D_A==0)=[];

[m1 n1]=sort(D_A,'descend'); D_B(D_B==0)=[];

[m2 n2]=sort(D_B,'descend');

%判断A与B的特征值是否相等: if n1~=n2

disp ('错误:A与B的特征值不相等') else

disp ('经验证,A与B的特征值相等') end

for i=1:length(D_A)

U(:,i)=U_A(:,n1(i)); end

for i=1:length(D_B)

V(:,i)=U_B(:,n2(i));

end

s=sum(abs(m1)); for i=1:length(m1) m1(i)=m1(i)/s; end

disp ('典型变量系数及相应典型相关系数依次为:') for i=1:length(D_A)

disp ('-----------分割线-----------') disp (i)

23

disp ('U=')

disp (U(:,i))

disp ('V=')

disp (V(:,i))

disp ('典型相关系数为:') disp (sqrt(abs(m1(i)))) end

24

网站首页网站地图 站长统计
All rights reserved Powered by 海文库
copyright ©right 2010-2011。
文档资料库内容来自网络,如有侵犯请联系客服。zhit326@126.com