葡萄酒的评价
摘要
本文针对葡萄酒的评价问题,建立了差异性分析模型、综合评价模型、多元线性回
归模型、多属性决策模型,对品酒员评价结果差异性进行了分析,对酿酒葡萄进行了分
级,分析了各理化指标之间的联系和对葡萄酒质量的影响,论证了用理化质量评价葡萄
酒质量的可行性。
对于问题一,为了判断两组评分有无显著性差异,首先进行了异常数据处理以及数
据的正态性检验,建立了基于 t-检验的显著性差异分析模型,得到在
的置信水
平下,两组品酒员对于红葡萄酒和白葡萄酒的评价结果均具有显著性差异的结论。为了
讨论哪组结果更可信,建立了基于差异系数和克隆巴赫系数的可信度计算模型,讨论了
外部一致性和内部一致性的关系,得出了对于外部一致性第二组可信度高于第一组,而
对于内部一致性第一组可信度高于第二组的结论。
对于问题二,为了解决酿酒葡萄的分级问题,将酿酒葡萄的理化指标进行主成分分
析后的主成分作为客观指标,将品酒员对葡萄酒质量的评分视为主观指标,建立了综合
评价模型,并利用差异系数分析得到了客观指标和主观指标之间的权重。利用该评价模
型对酿酒葡萄进行评分后,参考国际上葡萄酒的常见分类等级数,利用 K-均值聚类分析
将葡萄分为了四个等级,得出了红葡萄中样品 9 属于一级,样品 23、3、2 属于二级,
样品 14、21、17、1、19、5、8、20、13、24、22、16 属于三级,样品 10、26、27、4、
25、6、15、12、11、7、18 属于四级;白葡萄中样品 27 属于一级,样品 24、15、6、
10、5、9、28、18、23、21、20、3、25、17、22、7 属于二级,样品 14、13、4、1、2、
12、26、11、19 属于三级,样品 8、16 属于四级的结论。
对于问题三,为了分析酿酒葡萄与葡萄酒理化指标间的联系并确定葡萄酒理化指标
与酿酒葡萄理化指标的函数关系,通过相关性分析筛选出了与葡萄酒理化指标显著相关
的酿酒葡萄理化指标,然后建立了多元线性回归模型,解得到葡萄酒理化指标与相关酿
酒葡萄理化指标的函数关系。以红葡萄酒理化指标“花色苷”为例,其关于红葡萄苏氨
酸、甘氨酸、蛋氨酸、白藜芦醇的函数关系为
。
这说明了葡萄酒理化指标不仅只与酿酒葡萄对应的指标有关,还与酿酒葡萄其他指标有
联系。
对于问题四,为了分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用相
关性分析方法筛选出了各项特征性成分,建立了多属性决策模型,利用信息熵定出各属
性权重并考虑指标的相关系数,确立多元线性评价模型,得到酿酒葡萄、葡萄酒的理化
指标与葡萄酒质量的函数式,即可定量反映二者对葡萄酒质量的影响程度。并分别对各
红白葡萄酒样进行评价,将所得的分数与品酒员所评葡萄酒总分数作出比较,并排序。
采用 Wilcoxoon 符号平均秩检验,得渐进显著性(双侧)为 0.638,远大于显著性水平
0.05,可知评价模型较高的显著性,所建模型合理,论证了用葡萄和葡萄酒的理化指标
来评价葡萄酒的质量的可行性。
本文最大的特色在于针对各问题均从多个方面进行了分析,如判断可信度时讨论了
内部一致性和外部一致性的联系,为酿酒葡萄分级时考虑了客观因素和主观因素。
关键词:葡萄酒评价、显著性检验、相关性分析、多元线性回归、样本非参数检验
1
0.051234y=1+1.85700.3033z3.6039z1.0716zz
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的品酒员进行品评。每个品酒员在对
葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标
会在一定程度上反映葡萄酒和葡萄的质量。附件 1 给出了某一年份一些葡萄酒的评价结
果,附件 2 和附件 3 分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建
立数学模型讨论下列问题:
1. 分析附件 1 中两组品酒员的评价结果有无显著性差异,哪一组结果更可信?
2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄
酒的理化指标来评价葡萄酒的质量?
二、基本假设
1、假设同一评酒师对同一种类的葡萄酒的评分标准相同。
2、假设品酒过程中的第三方因素(如环境)皆不会对评分结果产生影响。
3、假设同一种类的葡萄酒酿造工艺和储存条件相同。
4、假设所用酿酒葡萄均为自然生长,不包含人工激素。
2
三、符号说明
品酒员 对酒样品 的第 项指标的评分
、
品酒员 对酒样品 的总评分
两组品酒员对各酒样品的最终评分
、 两组评分结果的均值
、 两组评分结果的方差
同一组品酒员对编号为 的酒样品评分结果的变异系数
、
同一组品酒员对编号为 的酒样品评分结果的克隆巴赫系数
酿酒葡萄理化指标的样本阵
酿酒葡萄理化指标的标准阵
酿酒葡萄理化指标的标准阵的相关系数矩阵
样本 的第 个主成分评分
线性回归回归参数估计值
多元线性回归评价系统变量
多元线性回归评价系统因变量:酿酒葡萄、葡萄酒理化指标
四、问题分析
题目中已知两组品酒员对各葡萄酒的评分数据,并给出了酿酒葡萄和葡萄酒的理化
指标,要求分析数据来判断品酒员评分的可信度、以及研究酿酒葡萄和葡萄酒的理化指
标相互之间的联系和对葡萄酒质量的影响。
在问题一中,判断两组品酒员的评价结果有无显著性差异的关键在于建立一个模型
计算两组结果分布的近似程度。而判断两组评价结果谁更可信,则可从同一组品酒员对
同一酒样品评分时内部意见的统一程度来判断。
在问题二中,为对酿酒葡萄进行分级,可先对酿酒葡萄的众多理化指标进行降维,
筛选其中较为重要的项,并从客观层面得到这些项的权重。之后利用品酒员对葡萄酒质
量的打分,得到一个葡萄酒质量指标主观权重。结合客观权重和主观权重后,再对各葡
萄样品进行打分,根据分值的分布情况进行分类从而完成酿酒葡萄的分级。
在问题三中,要求分析酿酒葡萄与葡萄酒的理化指标之间的联系,即确立葡萄酒理
化指标的酿酒葡萄的理化指标的函数关系。可先将葡萄酒理化指标与酿酒葡萄理化指标
进行相关性分析,找出与葡萄酒理化指标关系比较显著的酿酒葡萄理化指标,再通过回
归模型便可得到葡萄酒理化指标关于酿酒葡萄理化指标的函数关系式。
在问题四中,为分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,可分别对
酿酒葡萄、葡萄酒的理化指标与对应的葡萄酒的质量利用统计学方法找到相关特征性指
标,建立相关模型对各指标定权重,再依据权重和指标的相关系数制定一个以酿酒葡萄
和葡萄酒的理化指标为变量,寻求葡萄酒质量的评价系统,分别为各红白葡萄酒样打分,
与品酒员的所评葡萄酒分数作比较,论证该评价系统的适用性,即论证能否用葡萄和葡
萄酒的理化指标来评价葡萄酒的质量。
3
ijkxjki*jkxjk1X2X1X2X12X22X.kxCVkkxkXZRijPijG1H2H
五、模型的建立与求解
5.1 问题一模型建立与求解
5.1.1 缺失数据补全及异常数据处理
观察表格发现,附件1中“第一组红葡萄酒品尝评分”表格里品酒员4号对酒样品20
色调的评分数据缺失;“第一组白葡萄酒品尝评分”表格里品酒员7号对酒样品3持久性
的评分为“77”,已远大于该项满分“8”,可视其为无效数据,将其去除。
去除异常评分的品酒员数据,将其他9位品酒员对有异常数据酒样品指标的评分取平
均值,将该平均值作为异常评分的替代值以减少因补全数据而对酒样品整体评分的影响,
因此附件1中“第一组红葡萄酒品尝评分”表格里品酒员4号对酒样品20色调的评分和“第
一组白葡萄酒品尝评分”表格里品酒员7号对酒样品3持久性的评分分别为6分、6分。
5.1.2 两组评价结果的显著性差异分析
(1)各酒样品评分结果的确定
品酒员对酒样品的评分指标有十项,分别为澄清度、色调、纯正度、浓度、质量、
纯正度、浓度、持久性、质量、平衡/整体评价。按先后顺序设其为第
项指标。
设 为品酒员 对酒样品 的第 项指标的评分,则品酒员 对酒样品 的总评分
为:
取同组十位品酒员对酒样品 总评分的平均值为该酒样品的最终评分 ,则酒样品
的最终评分为:
(1)
(2)
(2)显著性差异分析 t 检验的使用条件判断
t 检验是用 t 分布理论[1]来推论差异发生的概率,从而比较两个平均数是否存在显著
差异的方法。其适用于样本含量较小的正态分布资料。其适用条件有三:1、已知一个
总体均数;2、可得到一个样本均数及该样本标准差;3、样本来自正态或近似正态总体。
前 2 条易判断已满足,下面验证两组品酒员评价结果服从正态分布。
利用 MATLAB(程序见附录 1)绘制正态分布概率图(以第二组评酒师对红葡萄酒评
分为例,其余三组概率分布图见附录 1):
4
1,2,3,,10ijkxjkijk*jkx10*1jkijkixxkkxk10*110jkjkxx
图 1 第二组评酒师对红葡萄酒评分的正态分布概率图
由上图可以发现,第二组评酒师对红葡萄酒的评分的概率分布散点图均匀分布在一
条直线的两侧,说明这组数据为正态分布。同理可得其他三组评分同样符合正态分布。
(3)采用 t 检验的两组品酒员评价结果显著性差异分析模型
若两组品酒员评价结果无显著性差异,则其评分均值应大致相等。因此可在检验前
提出如下假设:
采用成对双样本均值分析检验两组结果相互之间的差异,检验公式如下:
(3)
式中, , 分别为两组结果的均值, 、 分别为两组结果的方差, 为每组
结果的数量, 为两组结果间的泊松相关系数[4], 的计算公式为:
自由度为
,查 值表可得到置信水平
下的临界值
,若其大于 则接受原假设,否则拒绝。
(4)
,求概率
利用 EXCEL 的“数据分析”工具对两组品酒员对各酒样品的最终评分进行“t-检验:
成对双样本均值分析”,整理之后得到如下表格(各酒样品表格见附录 2):
表 1 t-检验: 成对双样本均值分析结果
红
葡
萄
酒
平均
方差
泊松相关系数
df
t Stat
P(T<=t) 双尾
第一组评价结果 第二组评价结果
73.078
54.183
70.515
15.824
0.702
26
2.478
0.020
5
H012H112:=,原假设,第一组品酒员和第二组品酒员评分均值相等:,备择假设,第一组品酒员和第二组品酒员评分均值不相等1212122221XXXXXXtn1X2X12X22Xn1122221122XXXXXXXX1dfnt0.050.05tdf0.05{}PPttdf
t 双尾临界
2.779
平均
方差
74.011
23.079
76.532
10.055
泊松相关系数
df
t Stat
P(T<=t) 双尾
t 双尾临界
0.240
27
-2.625
0.014
2.771
白
葡
萄
酒
在
时,若
可得结论:在
均具有显著性差异。
,则应拒绝原假设。0.020 和 0.014 明显小于 0.05,因此,
的置信水平下,两组品酒员对于红葡萄酒和白葡萄酒的评价结果
5.1.3 两组评价结果的可信度比较
“可信度”即结果的“精密度”,表示多次评定结果互相接近的程度。对同一对象
的两个评分结果而言,其密集程度越高者,则可信度越高。而对两个评分系统而言,则
还需要比较一个系统对多个对象评分结果的可信度高于另一系统的比例。
(1)变异系数[5]可靠度计算模型
变异系数(又称“标准差率”)是衡量各检测值变异程度的无量纲量。由于其不需要
参照数据的平均值,因此在比较两组量纲不同或均值不同的数据时,应该用变异系数而
是同一
不是标准差来作为比较的参考。变异系数越小则代表其外部一致性越大。设
组品酒员对编号为 的酒样品评分结果的变异系数。则:
式中, 是同一组品酒员对编号为 的酒样品评分结果的标准差, 的编号为 的
酒样品评分结果的平均值。
利用 EXCEL 算出两组品酒员对同一酒样品评分的变异系数,得下表(仅列出部分酒
样品,完整表格见附录 3):
(5)
变异系数
酒样品 1
酒样品 2
酒样品 3
酒样品 4
酒样品 5
„
酒样品 27
酒样品 28
变异系数第一组高
于第二组的比例
表 2 变异系数表
红葡萄酒
白葡萄酒
第一组 第二组 第一组 第二组
16.46% 13.36% 12.50%
3.69%
7.19%
30.11%
5.51%
20.94%
9.83%
6.33%
17.50%
6.26%
6.08%
3.58%
19.79%
9.40%
2.44%
4.57%
6.44%
2.10%
„
„
7.58%
3.19%
74.07%
„
24.76%
11.00%
„
5.13%
3.54%
78.57%
由表可得,除红葡萄酒样品 8、10、16、19、20、26 及白葡萄酒样品 7、9、12、25、
26 第二组评分的变异系数大于第一组外,其他均为第一组大于第二组。即第一组评分外
6
0.050.05P0.05.kxCVk.100%kkxxkCVxkxkkxk
部一致性大于第二组的概率较大。由此可得出结论:若利用方差来表征可靠度则对于红
葡萄酒和白葡萄酒,第二组结果的可信度高于第一组的可能性分别为 74.07%、78.57%。
(2)克隆巴赫系数[6]可靠度计算模型
克隆巴赫系数(又称“信度系数”),是心理或教育测验中最常用的信度评估工具。
它依一定公式估量测验的内部一致性,巴赫系数越大则代表内部一致性越大。设 是
同一组品酒员对编号为 的酒样品评分结果的克隆巴赫系数。则:
式中, 是评分指标的数量, 是各指标得分的方差, 是总得分的方差。
利用 EXCEL 算出两组品酒员对同一酒样品评分的克隆巴赫系数,得下表(仅列出部
分酒样品,完整表格见附录 4):
表 3 克隆巴赫系数表
(6)
克隆巴赫系数
酒样品 1
酒样品 2
酒样品 3
酒样品 4
酒样品 5
„
酒样品 27
酒样品 28
克隆巴赫系数第一组
高于第二组的比例
红葡萄酒
白葡萄酒
第一组 第二组 第一组 第二组
0.76
0.83
0.92
0.85
0.66
„
0.83
0.62
0.88
0.94
0.65
0.76
0.90
„
0.91
0.81
71.43%
0.85
0.83
0.74
0.86
0.81
„
0.68
0.83
0.43
0.73
0.79
0.34
„
0.69
62.96%
由表可得,除红葡萄酒样品 8、9、10、14、16、19、20、25、26、27 及白葡萄酒样
品 7、8、9、20、25、26 第二组评分的克隆巴赫系数大于第一组外,其他均为第一组大
于第二组。即第一组评分内部一致性大于第二组的概率较大。可得出结论:若利用克隆
巴赫系数来表征可靠度则对于红葡萄酒和白葡萄酒,第一组结果的可靠度高于第二组的
可能性分别为 62.96%、71.43%。
5.1.4 问题一结果的分析与解释
(1)结果的分析
从变异系数和克隆巴赫系数来分析两组评分的可信度可得到以下结论:
1、从外部一致性来看,对红白两种葡萄酒第二组结果的可信度高于第一组的可能性
2、从内部一致性来看,对红白两种葡萄酒第一组结果的可信度高于第二组的可能性
分别为 74.07%、78.57%。
分别为 62.96%、71.43%。
3、对红葡萄酒样品 8、10、16、19、20、26 和白葡萄酒样品 7、9、25、26 而言,
两组评分不存在同时较高的外部一致性和内部一致性,即对于这些葡萄酒样品各位品酒
7
kxk21211kniixtnnn2i2t
员的意见分歧较大。
(2)结果的解释
下面将解释为何会出现外部一致性较高时内部一致性却较低的情况,假设有甲、乙
两组评分员对两个指标 A、B 评分,结果如下:
表 4 假设的评分情况
甲
乙
3
6
9
4
7
11
4
6
10
6
4
10
A 指标
B 指标
总评分
观察上表可知,虽然甲组评分员的最终评分之间区别较大,但组内成员都认为 B 指
标的得分应高于 A 指标,即内部一致性大而外部一致性小。而乙组评分员的最终评分之
间虽然没有区别,但组内成员认为 AB 指标的得分相对高低却不同,即外部一致性大而
内部一致性小。
当需要对比多个待评价样本时,应参考外部一致性大的组别。
而当需要对某一样本进行评价时,则应参考内部一致性大的组别。
5.2 问题二模型建立与求解
酿酒葡萄的理化指标为客观存在的数据,而葡萄酒质量的各个指标则是两组品酒员
的主观打分,在对酿酒葡萄进行评价及分级时,应结合客观和主观两个因素的权重得到
最终评分。而分级时则可参考葡萄酒的评分标准并结合评分的分布特点选择划分方案。
本问思路如下所示:
图 2 问题二的思路
5.2.1 异常数据处理
观察发现附件 2 中红葡萄样品 10 的 VC 含量 10.2、10.3 远远高于其余样品的 VC 含
量平均值,易断定其为异常数据,修改其值为 0.2、0.3。
5.2.2 基于主成分分析的客观评分确定
在研究多指标问题时,指标太多会增大计算量和增加分析问题的复杂性,因此需要
对指标进行降维处理。主成分分析[7]是解决这一问题的理想工具,它从多个指标之间的
相互关系入手,将多个指标化为少数几个不相关的综合指标,同时保持数据集的对方差
贡献最大的特征。
8
最终评分客观评分主观评分各理化指标确定权重直接利用葡萄酒评分表中的指标权重和评分权重主成分分析确定重要指标聚类分析分级