论文部分内容阅读
对葡萄酒的质量等级划分,主要是由一些资深的品酒员对其的打分来衡量的,而不同的品酒员对同一葡萄酒评分各不相同,为了对某一葡萄酒的质量给出一个评价,我们就有必要检验不同组品酒员打分的可信度。考虑到上述同题,文章首先对题目所给的数据进行了清洗,然后用统计上的假设检验方法对不同组品酒员的打分进行检验,再用变异系数对可信度进行判定。
假设检验 主成分分析
研究背景
随着经济的发展,人们生活水平的不断提高,各类进口葡萄酒不断的涌人中国市场,不仅引起了创业者对其的兴趣,也吸引了很多中国学者对其的研究。
由于葡萄酒越来越受广大人民的喜爱,这在一定程度上也吸引了一些学者、研究员、分析师的的目光,经过查阅资料发现各个领域对葡萄酒都做了一些定性和定量的研究。鹿文丽,杨潘,王晶( 2017)以烟台葡萄酒旅游业为例,分析了葡萄酒旅游业中现代信息技术的应用程度和提升空间;林博学( 2017)研究了葡萄酒瓶上的软木塞应该如何制造才能使得葡萄酒的密封效果最好;黄鸿基,钱圳冰,冯帆,周行洲( 2017)根据酿酒葡萄的理化指标和葡萄酒的质量利用统计的方法来对酿酒葡萄进行分级。
综上,众多学者都对葡萄酒进行了研究。但大部分学者都没有对评酒员对葡萄酒的评分进行判定分析。针对研究的不足,文章在下文中对葡萄酒的不同组评酒员的评分进行了判定。
本文利用的数据是2012年全国大学生数学建模竞赛A题的数据,由于文章研究的问题与竞赛题目的问题有所差异,因此,文章只用了附件1的数据,来分析附件1中两组评酒员的评价结果有无显著差异,哪一组结果更可信。
模型建立与求解
(1)问题分析
葡萄酒的感官评价中,不同的品酒员对葡萄酒的评价在评价尺度方面存在不同的差异,由于定性分析总是不能使人们信服,所以就需要利用统计方法来对其进行检验;其次为了对葡萄酒选取一组质量评分标准,将利用统计方法从定量分析的基础上确定出一组评分做为葡萄酒的质量评选标准。
(2)模型建立与求解
1.正态性检验
对于问题一文章采用每组评酒员对每一样品各个理化指标打分的总和数据来分析,首先对附件一的两组数据用Excel进行加总分别得出红门两种葡萄得分的27个或28个总分值;其次,对数据文件1中的每一组数据用RStudio进行正太性检验,文章将采用JB进行检验,得到的四个JB值分别为4.01,3.20,2.09,1.98,均小于临界值5.99,故四组数据近似服从正太分布。
2.对两组品酒员评分显著性检验
根据上述检验,每组评酒员对每一样品评分的平均值服从正太分布,因此对第一组红葡萄酒样品,可以设λi:N(μi,σi)i=1,2,L,27,第二组红葡萄 酒 样 品 , 可 以 设λj:N(μj,σj),j=1,2,L,27,则对第一组和第二组红葡萄酒样品的评分有无显著性差异的问题,可以转化为如下假设检验模型:
Ho:μi=μj,Hl:μi≠μj
(1)
因为两组红葡萄酒评分的方差均不知道并且不可能相等,进而不能进行假设检验,于是将表达形式变形为D=λi-λj,则样本均值变为μ=μi-μj,因此第一个假设检验变为对“=0的t检验。变换后的样本均值数据见数据文件l,利用RStudio对第一组和第二组红葡萄酒样品平均值评分的差进行t检验,
分析運算结果可知,在显著性水平α=0.05下,p=1.027e-09小于其水平,因此拒绝原假设,即μi=μj,也就是说两组品酒员对红葡萄酒的评分存在显著性差异,同理,对于门葡萄酒,在显著性水平α=0.05下,p=1.027e-09小于其水平。综上,两组品酒员对红、门两组葡萄酒的打分存在显著差异。
其次,对第二个方差假设检验进行F检验:
首先求出第一组和第二组中每一品酒员对红葡萄酒每一样品打分的和后,再求每组中每一样品的方差,最后用RStudio对处理后的数据进行编程分析。
根据运行结果中p=0.04198,在在显著性水平α =0.05下,拒绝原假设,说明两组品酒员对红葡萄酒的评分存在差异。采用同样的方法,对两组门葡萄酒的每一样品评分数据进行分析,可得p=0.04088,在α=0.05下,拒绝原假设,说明两组品酒员对门葡萄酒的评分存在差异。
综上,两组品酒员对红门葡萄酒的评分在均值和方差上都存在显著性差异,所以可认为评酒员对红白葡萄酒的两组评价结果有显著性差异。
(3)两组品酒员评价结果可信度评估
要评价两组品酒员的评价结果的可信度,就要看两组评分中哪一组更稳定,因此用变异系数来判定,它常用来衡量样本值的离散程度,其值越小表示样本越集中,稳定性越好,可信度越高,反之。变异系数的计算公式如下:
其中σ表示样本标准差,x表示样本均值。
利用Excel计算了每一组品酒员的变异系数,第一组红、白葡萄为;9,86%、6.88%;第一组红、白葡萄为:5.54%、4.07%。可以看出第一组品酒员对红、门葡萄酒的评分变异系数远大于第二组的变异系数。所以,可以确定第二组品酒员的评分结果更可靠。
结论
文章利用2012年全国大学生数学建模竞赛A题的数据,来对酿酒葡萄和葡萄酒进行分析。首先通过假设检验验证了附件1中两组评酒员对葡萄酒的评分存在显著差异,最后用变异系数证明了第二组评酒员的评分可信度更高。
[1]网络资源:http: //baike.sogou.com/v66069.htm?fromTitle=%E8%91%A1%E8%90%84%E9%85%92, 2017.
[2]鹿文丽,杨潘,王晶.信息技术与葡萄酒旅游融合模式研究[J]冲国农业大学烟台研究院,2017.
[3]林博学.葡萄酒用软木塞的生产及品质控制[J].烟台张裕葡萄酿酒股份有限公司,2017.
[4]黄鸿基,钱圳冰,冯帆,周行洲.基于改进后的K-means算法研究根据酿酒葡萄和葡萄酒的理化指标对红葡萄酒的分级方法[J].南京邮电大学,2017.
[5]赵静,但琦.数学建模与数学实验[M].高等教育出版社.2014, 191-270.
[6]费宇.多元统计分析——基于R[M].中国人民大学出版社.2014.
假设检验 主成分分析
研究背景
随着经济的发展,人们生活水平的不断提高,各类进口葡萄酒不断的涌人中国市场,不仅引起了创业者对其的兴趣,也吸引了很多中国学者对其的研究。
由于葡萄酒越来越受广大人民的喜爱,这在一定程度上也吸引了一些学者、研究员、分析师的的目光,经过查阅资料发现各个领域对葡萄酒都做了一些定性和定量的研究。鹿文丽,杨潘,王晶( 2017)以烟台葡萄酒旅游业为例,分析了葡萄酒旅游业中现代信息技术的应用程度和提升空间;林博学( 2017)研究了葡萄酒瓶上的软木塞应该如何制造才能使得葡萄酒的密封效果最好;黄鸿基,钱圳冰,冯帆,周行洲( 2017)根据酿酒葡萄的理化指标和葡萄酒的质量利用统计的方法来对酿酒葡萄进行分级。
综上,众多学者都对葡萄酒进行了研究。但大部分学者都没有对评酒员对葡萄酒的评分进行判定分析。针对研究的不足,文章在下文中对葡萄酒的不同组评酒员的评分进行了判定。
本文利用的数据是2012年全国大学生数学建模竞赛A题的数据,由于文章研究的问题与竞赛题目的问题有所差异,因此,文章只用了附件1的数据,来分析附件1中两组评酒员的评价结果有无显著差异,哪一组结果更可信。
模型建立与求解
(1)问题分析
葡萄酒的感官评价中,不同的品酒员对葡萄酒的评价在评价尺度方面存在不同的差异,由于定性分析总是不能使人们信服,所以就需要利用统计方法来对其进行检验;其次为了对葡萄酒选取一组质量评分标准,将利用统计方法从定量分析的基础上确定出一组评分做为葡萄酒的质量评选标准。
(2)模型建立与求解
1.正态性检验
对于问题一文章采用每组评酒员对每一样品各个理化指标打分的总和数据来分析,首先对附件一的两组数据用Excel进行加总分别得出红门两种葡萄得分的27个或28个总分值;其次,对数据文件1中的每一组数据用RStudio进行正太性检验,文章将采用JB进行检验,得到的四个JB值分别为4.01,3.20,2.09,1.98,均小于临界值5.99,故四组数据近似服从正太分布。
2.对两组品酒员评分显著性检验
根据上述检验,每组评酒员对每一样品评分的平均值服从正太分布,因此对第一组红葡萄酒样品,可以设λi:N(μi,σi)i=1,2,L,27,第二组红葡萄 酒 样 品 , 可 以 设λj:N(μj,σj),j=1,2,L,27,则对第一组和第二组红葡萄酒样品的评分有无显著性差异的问题,可以转化为如下假设检验模型:
Ho:μi=μj,Hl:μi≠μj
(1)
因为两组红葡萄酒评分的方差均不知道并且不可能相等,进而不能进行假设检验,于是将表达形式变形为D=λi-λj,则样本均值变为μ=μi-μj,因此第一个假设检验变为对“=0的t检验。变换后的样本均值数据见数据文件l,利用RStudio对第一组和第二组红葡萄酒样品平均值评分的差进行t检验,
分析運算结果可知,在显著性水平α=0.05下,p=1.027e-09小于其水平,因此拒绝原假设,即μi=μj,也就是说两组品酒员对红葡萄酒的评分存在显著性差异,同理,对于门葡萄酒,在显著性水平α=0.05下,p=1.027e-09小于其水平。综上,两组品酒员对红、门两组葡萄酒的打分存在显著差异。
其次,对第二个方差假设检验进行F检验:
首先求出第一组和第二组中每一品酒员对红葡萄酒每一样品打分的和后,再求每组中每一样品的方差,最后用RStudio对处理后的数据进行编程分析。
根据运行结果中p=0.04198,在在显著性水平α =0.05下,拒绝原假设,说明两组品酒员对红葡萄酒的评分存在差异。采用同样的方法,对两组门葡萄酒的每一样品评分数据进行分析,可得p=0.04088,在α=0.05下,拒绝原假设,说明两组品酒员对门葡萄酒的评分存在差异。
综上,两组品酒员对红门葡萄酒的评分在均值和方差上都存在显著性差异,所以可认为评酒员对红白葡萄酒的两组评价结果有显著性差异。
(3)两组品酒员评价结果可信度评估
要评价两组品酒员的评价结果的可信度,就要看两组评分中哪一组更稳定,因此用变异系数来判定,它常用来衡量样本值的离散程度,其值越小表示样本越集中,稳定性越好,可信度越高,反之。变异系数的计算公式如下:
其中σ表示样本标准差,x表示样本均值。
利用Excel计算了每一组品酒员的变异系数,第一组红、白葡萄为;9,86%、6.88%;第一组红、白葡萄为:5.54%、4.07%。可以看出第一组品酒员对红、门葡萄酒的评分变异系数远大于第二组的变异系数。所以,可以确定第二组品酒员的评分结果更可靠。
结论
文章利用2012年全国大学生数学建模竞赛A题的数据,来对酿酒葡萄和葡萄酒进行分析。首先通过假设检验验证了附件1中两组评酒员对葡萄酒的评分存在显著差异,最后用变异系数证明了第二组评酒员的评分可信度更高。
[1]网络资源:http: //baike.sogou.com/v66069.htm?fromTitle=%E8%91%A1%E8%90%84%E9%85%92, 2017.
[2]鹿文丽,杨潘,王晶.信息技术与葡萄酒旅游融合模式研究[J]冲国农业大学烟台研究院,2017.
[3]林博学.葡萄酒用软木塞的生产及品质控制[J].烟台张裕葡萄酿酒股份有限公司,2017.
[4]黄鸿基,钱圳冰,冯帆,周行洲.基于改进后的K-means算法研究根据酿酒葡萄和葡萄酒的理化指标对红葡萄酒的分级方法[J].南京邮电大学,2017.
[5]赵静,但琦.数学建模与数学实验[M].高等教育出版社.2014, 191-270.
[6]费宇.多元统计分析——基于R[M].中国人民大学出版社.2014.