论文部分内容阅读
摘要:本论文目的在于解决2012 年中国大学生数学建模比赛A题中的二题。分析过程是以红葡萄为样本,白葡萄的相关结论类似方法可得。论文的数据处理借助SPSS 统计软件。我们采用聚类分析的统计方法,使用K-Means Cluster 分类法将葡萄酒成为3 组,采用Wilks’ Lambda方法对分类的葡萄进行判别,判别标准采用F值判别法。
关键字:葡萄酒质量与等级 理化性质 相关分析 聚类分析与判别分析 回归分析
中图分类号:F426.31 文献标识码:A 文章编号:1009-914X(2013)32-005-01
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论:
根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
二、模型建立与求解
我们了解到葡萄的某些理化指标反应了葡萄酒的质量,其质量与附件一的列表中葡萄酒评分员评分情况有一定关联。使用Excel表格计算出每项酿酒葡萄理化指标的平均值,用SPSS软件计算出酿酒葡萄的理化指标与其质量的相关性,以决定对葡萄酒质量影响最大的理化指标。取定理化指标后,用SPSS软件将葡萄酒按照理化指标进行聚类分析以得到葡萄酒的分级情况,再对葡萄酒的分级依据(包括Fisher判别函数,典则判别函数散点图)进行说明。
2.1 根据相关性矩阵(如图1)找出和葡萄酒质量最相关的三个红葡萄理化指标,它们分别是DPPH自由值、总酚和葡萄糖总黄酮。
澄清度 色调 纯正度 浓度 质量 纯正度 浓度 持久性 质量 平衡/整体评价
DPPH自由基 Pearson 相关性 -.104 .622** .585** .509** .564** .453* .394* .300 .165 .407*
显著性(双侧) .606 .001 .001 .007 .002 .018 .042 .129 .411 .035
N 27 27 27 27 27 27 27 27 27 27
总酚 Pearson 相关性 -.389* .589** .390* .529** .496** .535** .640** .406* .386* .448*
显著性(双侧) .045 .001 .045 .005 .009 .004 .000 .036 .047 .019
N 27 27 27 27 27 27 27 27 27 27
葡萄总黄酮 Pearson 相关性 -.196 .544** .459* .577** .652** .594** .642** .356 .376 .504**
显著性(双侧) .328 .003 .016 .002 .000 .001 .000 .068 .054 .007
N 27 27 27 27 27 27 27 27 27 27
图 1
2.2 根据过程1中分析出的与葡萄酒质量最相关的葡萄理化指标,将红葡萄和白葡萄使用K-Means Cluster分类成为3组,供以后的判别分析使用,最终分类如图2(红葡萄)
样品编号 分类 样品编号 分类 样品编号 分类
葡萄样品1 1 葡萄样品10 3 葡萄样品19 1
葡萄样品2 2 葡萄样品11 3 葡萄样品20 3
葡萄样品3 1 葡萄样品12 3 葡萄样品21 1
葡萄样品4 3 葡萄样品13 1 葡萄样品22 1
葡萄样品5 1 葡萄样品14 1 葡萄样品23 2
葡萄样品6 3 葡萄样品15 3 葡萄样品24 3
葡萄样品7 3 葡萄样品16 3 葡萄样品25 3
葡萄样品8 1 葡萄样品17 1 葡萄样品26 3
葡萄样品9 2 葡萄样品18 3 葡萄样品27 3
图2
2.3 采用Wilks’ Lambda方法对图2中分类的葡萄进行判别,判别标准采用F值判别法,输出Fisher判别函数,用于对新样本的判别(以红葡萄为例)。
红葡萄:
特征值
函数 特征值 方差的 % 累积 % 正则相关性
1 7.579a 96.7 96.7 .940
2 0.259a 3.3 100.0 .453
图3
图3列出了红葡萄的判别函数。
判别函数的特征值越大,表明该函数越具有区别力。红葡萄第一个判别函数的特征值为7.579,第二个判别函数的特征值为0.259。最后一列为典型相关系数,表示判别函数分数与组别间的关联程度。
下面在用Wilks 的 Lambda方法判断函数显著性:
Wilks 的 Lambda
函数检验 Wilks 的 Lambda 卡方 df Sig.
1到22 .093 55.916 4 .000
.794 5.406 1 .020
图4
2.4 分级判断标准的Fisher判定函数。
分类函数系数
案例的类别号
1 2 3
葡萄总黄酮 .223 1.651 .231
总酚 2.791 4.086 1.545
(常量) -26.159 -76.266 -9.328
注:Fisher 的线性判别式函数
图5
相較于葡萄总黄酮和总酚,DPPH自由值相关系数较小以至于可以忽略不计。
2.5 结果与结论:
在模型中,我们得到了红葡萄的分级情况以及相应的分级判定标准Fisher判别函数:
第一组Fisher判别函数为:
F1=0.223×葡萄总黄酮+2.791×总酚-26.159
第二组Fisher判别函数为:
F2=1.651×葡萄总黄酮+4.086×总酚-76.266
第三组Fisher判别函数为:
F3=0.231×葡萄总黄酮+1.545×总酚-9.328
参考文献说明:
[1]宋志刚,谢蕾蕾,何旭洪;SPSS 16实用教程;北京;中国邮电出版社,2008。
[2]王力宾;多元统计分析:模型,案例及SPSS应用;经济科学出版社,2010。
[3]张丽芝;贺兰山东麓红葡萄酒的等级划分客观标准的初步研究;《中国食物与营养》期刊,2012。
关键字:葡萄酒质量与等级 理化性质 相关分析 聚类分析与判别分析 回归分析
中图分类号:F426.31 文献标识码:A 文章编号:1009-914X(2013)32-005-01
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论:
根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
二、模型建立与求解
我们了解到葡萄的某些理化指标反应了葡萄酒的质量,其质量与附件一的列表中葡萄酒评分员评分情况有一定关联。使用Excel表格计算出每项酿酒葡萄理化指标的平均值,用SPSS软件计算出酿酒葡萄的理化指标与其质量的相关性,以决定对葡萄酒质量影响最大的理化指标。取定理化指标后,用SPSS软件将葡萄酒按照理化指标进行聚类分析以得到葡萄酒的分级情况,再对葡萄酒的分级依据(包括Fisher判别函数,典则判别函数散点图)进行说明。
2.1 根据相关性矩阵(如图1)找出和葡萄酒质量最相关的三个红葡萄理化指标,它们分别是DPPH自由值、总酚和葡萄糖总黄酮。
澄清度 色调 纯正度 浓度 质量 纯正度 浓度 持久性 质量 平衡/整体评价
DPPH自由基 Pearson 相关性 -.104 .622** .585** .509** .564** .453* .394* .300 .165 .407*
显著性(双侧) .606 .001 .001 .007 .002 .018 .042 .129 .411 .035
N 27 27 27 27 27 27 27 27 27 27
总酚 Pearson 相关性 -.389* .589** .390* .529** .496** .535** .640** .406* .386* .448*
显著性(双侧) .045 .001 .045 .005 .009 .004 .000 .036 .047 .019
N 27 27 27 27 27 27 27 27 27 27
葡萄总黄酮 Pearson 相关性 -.196 .544** .459* .577** .652** .594** .642** .356 .376 .504**
显著性(双侧) .328 .003 .016 .002 .000 .001 .000 .068 .054 .007
N 27 27 27 27 27 27 27 27 27 27
图 1
2.2 根据过程1中分析出的与葡萄酒质量最相关的葡萄理化指标,将红葡萄和白葡萄使用K-Means Cluster分类成为3组,供以后的判别分析使用,最终分类如图2(红葡萄)
样品编号 分类 样品编号 分类 样品编号 分类
葡萄样品1 1 葡萄样品10 3 葡萄样品19 1
葡萄样品2 2 葡萄样品11 3 葡萄样品20 3
葡萄样品3 1 葡萄样品12 3 葡萄样品21 1
葡萄样品4 3 葡萄样品13 1 葡萄样品22 1
葡萄样品5 1 葡萄样品14 1 葡萄样品23 2
葡萄样品6 3 葡萄样品15 3 葡萄样品24 3
葡萄样品7 3 葡萄样品16 3 葡萄样品25 3
葡萄样品8 1 葡萄样品17 1 葡萄样品26 3
葡萄样品9 2 葡萄样品18 3 葡萄样品27 3
图2
2.3 采用Wilks’ Lambda方法对图2中分类的葡萄进行判别,判别标准采用F值判别法,输出Fisher判别函数,用于对新样本的判别(以红葡萄为例)。
红葡萄:
特征值
函数 特征值 方差的 % 累积 % 正则相关性
1 7.579a 96.7 96.7 .940
2 0.259a 3.3 100.0 .453
图3
图3列出了红葡萄的判别函数。
判别函数的特征值越大,表明该函数越具有区别力。红葡萄第一个判别函数的特征值为7.579,第二个判别函数的特征值为0.259。最后一列为典型相关系数,表示判别函数分数与组别间的关联程度。
下面在用Wilks 的 Lambda方法判断函数显著性:
Wilks 的 Lambda
函数检验 Wilks 的 Lambda 卡方 df Sig.
1到22 .093 55.916 4 .000
.794 5.406 1 .020
图4
2.4 分级判断标准的Fisher判定函数。
分类函数系数
案例的类别号
1 2 3
葡萄总黄酮 .223 1.651 .231
总酚 2.791 4.086 1.545
(常量) -26.159 -76.266 -9.328
注:Fisher 的线性判别式函数
图5
相較于葡萄总黄酮和总酚,DPPH自由值相关系数较小以至于可以忽略不计。
2.5 结果与结论:
在模型中,我们得到了红葡萄的分级情况以及相应的分级判定标准Fisher判别函数:
第一组Fisher判别函数为:
F1=0.223×葡萄总黄酮+2.791×总酚-26.159
第二组Fisher判别函数为:
F2=1.651×葡萄总黄酮+4.086×总酚-76.266
第三组Fisher判别函数为:
F3=0.231×葡萄总黄酮+1.545×总酚-9.328
参考文献说明:
[1]宋志刚,谢蕾蕾,何旭洪;SPSS 16实用教程;北京;中国邮电出版社,2008。
[2]王力宾;多元统计分析:模型,案例及SPSS应用;经济科学出版社,2010。
[3]张丽芝;贺兰山东麓红葡萄酒的等级划分客观标准的初步研究;《中国食物与营养》期刊,2012。