基于因子分析的葡萄等级综合评判模型

来源 :中国科技博览 | 被引量 : 0次 | 上传用户：zhuxuxu520

【摘要】

：

【作者】

：

邱扬

【出处】

：

中国科技博览

【发表日期】

：

2013年27期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：本文围绕葡萄酒的质量评价问题进行分析，使用秩和检验和离散系数找到更可信的质量评价结果后，采用因子分析综合评判法得到葡萄的分级。建立葡萄和葡萄酒理化指标主成分的逐步回归模型，简化影响葡萄酒质量的指标，在非严格条件下认为可利用本模型以葡萄和葡萄酒的理化指标评价葡萄酒的质量。本文模型可以推广至医药等与多元统计相关的领域。
　　关键词：葡萄酒评价因子分析主成分分析
　　【分类号】：TS262.6；TP183
　　引言
　　近年来，随着人们生活水平的提高，葡萄酒也越来越为大家所熟知，医学表明：葡萄的营养很高，而以葡萄为原料的葡萄酒也蕴藏了许多氨基酸、矿物质和维生素，这些都是人体必须补充和吸收的营养品。然而，市面上出售的葡萄酒质量高低不同，其所具有的营养价值也就不同，如何鉴别葡萄酒的好坏也成为人们关注的焦点。确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分，然后求和得到其总分，从而确定葡萄酒的质量。同时，酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系，葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
　　1葡萄理化指标与葡萄酒质量的相关性分析
　　1.1基本原理
　　实际问题中，两个变量X、Y只能提供对应观察值：
　　我们也只能根据这个容量为的样本来判断变量和的相关性达到怎样的程度。
　　取相关系数的估计为：
　　这个估计称为相关系数。它能够根据样本观察值计算两个变量相关系数的估计值。
　　样本相关系数也有和总体相关系数类似的性质：
　　当时，变量和有线性关系：；且当时，，称和正相关；时，，称和负相关。和总体相关系数一样，如果，称和不相关。这时它们没有线性关系。
　　多数情况下，样本相关系数取区间中的一个值。相关系数的绝对值越大，表明和之间存在的关系越接近线性关系。
　　1.2模型的建立与求解
　　首先，按式（3）对各变量进行相关系数的计算。已知酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系，故采用第二组品评结果作为一个变量，以酿酒葡萄的各个理化特性分别作为另一变量进行相关性分析，得出红葡萄各理化指标的相关系数。
　　然后，根据相关系数对变量进行降维处理。根据的指标及的指标，认为相关性较小，可以忽略。最终得出初步降维后的红葡萄剩余指标及其相关系数。
　　2 葡萄理化指标的聚类分析
　　2.1基本原理
　　R型聚类即对变量聚类。在变量较多且变量间的相关性较强时，可以用R型聚类法找出代表性变量，以减少变量个数，达到降维的目的。R型聚类把变量聚为几个类，同一类变量之间有较强的相关性，因此可以从中选择一个变量作为代表。
　　以下介绍代表性变量的选择方法：假设变量构成一个类，为选择代表性变量，首先计算变量和的相关系数：。接着，对每个变量按以下公式计算：
　　其中是所在类的变量个数，此处。选最大者对应的变量为代表性变量。
　　2.2模型的建立与求解
　　对于相关性分析后剩余的红葡萄理化指标，使用相关系数法和Z-得分的标准化法进行系统聚类分析，利用SPSS相关操作进行后，输出文件关于变量分类：红葡萄的理化指标被分为了12类，对于每一类我们均可以求出代表性向量。下面以第一类指标为例进行说明。首先计算变量蛋白质、固酸比和PH值之间的相关系数，根据式（2），对于变量蛋白质，有；对于变量PH值，有；对于变量固酸比，。由于的值最大，故取变量PH值为第一类指标的代表性变量。同理可以得到其他类指标的代表性变量。
　　3 基于因子分析的葡萄等级综合评判
　　3.1基本原理
　　因子分析法的基本思想是将观测变量进行分类，将相关性较高，即联系比较紧密的分在同一类中，而不同类变量之间的相关性则较低，那么每一类变量实际上就代表了一个基本结构，即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。
　　因子分析的步骤：
　　1）将原始数据标准化，以消除变量间在数量级和量纲上的不同。
　　2）求标准化数据的相关矩阵；
　　3）求相关矩阵的特征值和特征向量；
　　4）计算方差贡献率与累积方差贡献率；
　　5）确定因子：
　　设为个因子，其中前个因子包含的数据息总量（即其累积贡献率）不低于时，可取前个因子来反映原评价指标；
　　6）因子旋转：
　　若所得的个因子无法确定或其实际意义不是很明显，这时需将因子进行旋转以获得较为明显的实际含义。
　　7）用原指标的线性组合来求各因子得分：
　　采用回归估计法，Bartlett估计法或Thomson估计法计算因子得分。
　　8）综合得分
　　以各因子的方差贡献率为权，由各因子的线性组合得到综合评价指标函数。其中，为旋转前或旋转后因子的方差贡献率。
　　9）得分排序：利用综合得分可以得到得分名次。
　　3.2模型的建立与求解
　　首先对于葡萄酒的质量，题设中并没有给出每个样品的葡萄酒质量。因此，为了简化模型，我们以问题一种感官评价的得分来代表葡萄酒的质量。在以上分析的基础上，我们便得到了对于葡萄评价的指标矩阵。下面我们通过因子分析综合评判法给出模型的解答。
　　我们使用主成分法进行因子分析，利用SPSS进行相应的操作，得到主要因子的方差贡献率和累计方差贡献率。其中，前七个主要成分的累计共享率达到了83%，超过了规定的80%。所以选取此七项进行综合评判，得到主要因子得分系数矩阵并由此可得其成分分别为：
　　利用SPSS中可以得到主成分的得分值，再分别以七个主成分的贡献值为权重构建主成分综合评判模型：
　　4模型的评价与改进
　　因子分析可以方便的对海量数据起到降维数的作用，构造综合评价时所涉及的权数具有客观性；在信息损失不大的前提下，极大地减少了评价工作量。模型的建立是在对样本数据进行充分挖掘的基础之上的，提高了模型的精确性。但进行数据预处理时，舍去了一些相关行较低的指标，可能降低评价指标体系的完善性。
　　可以采用通径分析和判别分析来进一步提高筛选的准确性和效率性，同时对筛选结果进行分析验证。可以使用神经网络来代替回归分析，有利于提高模型的准确性和广泛性。本模型可以利用到其他的多元统计问题中，如医学等领域。
　　5.参考文献
　　[1] 韩中庚，《数学建模方法及其应用》，北京：高等教育出版社，2009年6月第2版：118—122.
　　[2] 盛骤、谢式千、潘承毅，《概率论与数理统计》，北京：高等教育出版社，2008年6月第4版：208—214.
　　[3] 马莉，《数学实验与建模》，北京：清华大学出版社，2010年1月第1版：150-152.
　　[4] 陈杰，《MATLAB宝典》，北京：电子工业出版社，2011年11月：299-305.
　　[5] 李华、刘曙东、王华、张予林，《葡萄酒感官评价结果的统计分析方法研究》，中国食品学报，第6卷第2期：126—131，2006年4月。
　　[6] 李运、李记明、姜忠军，《统计分析在葡萄酒质量评价中的应用》，酿酒科技，总第178期：79-82，2009年。

其他文献

对地质找矿中勘探技术探讨

摘要：找矿工作关于我国的生产发展和能源供给，必须重视其找矿地质勘探工作。本文从现代找矿地质勘探技术创新出发，对地质勘查与找矿技术进行了探讨。　　关键词：地质找矿勘查技术　　中图分类号：P623.3　　随着科学技术的提高，经济的发展对矿产的依赖的增加，地质矿产勘查中有很多的勘查手段得到了广泛应用，但是如何将这些手段能够科学合理的综合应用起来成为一种重要的问题。将这些方法结合在一起，其找矿能力和经

期刊

谈当今电力企业如何做好用电检查工作

[摘要] 未来的电力发展将会更加迅猛，随着智能电网建设的不断深入，很多新的问题正在朝我们走来。如何做好前期调研，主动应对，防止失控，实现用电检查工作的科学高效管理，是我们每个用电检查人员应思考的问题。本文通过加强用电检查管理，进一步提升电力公司营销管理水平，使电力公司朝着又好又快的方向进行发展。　　[关键词] 供电企业用电检查思考　　中图分类号：TM73 文献标识码：文章编号：　　在当今社

期刊

城市天然气供应方案对比

摘要：LNG与CNG作为非管输供气方案各有其适用条件，影响方案选择的主要因素有气源价格、运输距离、供气规划、用气规模等。本文从气源价格、运输和储配站的投资等经济角度对影响中小城市燃气供应方案选择的因素进行了分析。　　关键词：城市、天然气、供应、经济性、分析　　【分类号】：TU996.9　　1 概述　　为了满足经济发展需要、提高人民生活水平和保护环境，我国正在大力推广使用天然气。随着我国“西气东输”

期刊

浅谈Linux操作系统的基本安全配置

摘要：随着Linux操作系统被广泛地应用于网络服务的主机系统中，它的安全性也越来越受到关注，本文简单介绍了Linux系统的安全机制，主要从用户帐号、文件系统权限、文件系统完整性检查、有效控制服务器运行的后台进程等几个方面给出相应的安全机制设置。　　关键词：Linux、安全、配置　　【分类号】：TP316.81　　相对于Windows系统，Linux系统往往会被认为具有更高的安全性，这也使得Linu

期刊

水稻栽培技术之己见

摘要：的人以大米为食，因为大米的用途广泛，除了可以做成各种食物以外还可以酿酒、制糖作工业原料等，而稻壳、稻秆也有很多用处。因此水稻得到的广泛大量的种植，水稻的栽培技术一般包括整地、育苗、插秧、除草除虫、施肥、灌排水、收成七大步骤，并重点来介绍病虫害防治技术，为广大农民朋友增产增收提供宝贵意见。　　关键词：水稻；栽培技术；病虫害防治　　中图分类号：S51　　前言　　水稻，所结稻粒去壳后就被称做大米，

期刊

基于AT89C52单片机温度测控系统的硬件设计

摘要：本文介绍了基于AT89C52单片机的温度测控系统的硬件设计。该系统采用DS18B20进行温度采集，通过AT89C52单片机外围电路来实现温度的设定、显示以及报警。该温度测控系统测温范围为- 55℃～ + 125 ℃，它具有读数方便、测温范围广、测温准确等优点，被广泛运用于工业生产、日常生活中。　　Abstract： This paper introduces the hardware des

期刊

一种控制中央空调的新方法

摘要：近年来，随着科学技术的不断发展，人们生活水平的不断提高，生活节奏的也不断提升，因此，人们对家居或者是生活办公环境的质量要求也在逐步提升。改善家居和生活办公环境，从控制中央空调的新方法开始。　　关键词：控制；中央空调；新方法　　【分类号】：TB657.2　　一、无线远程空调的技术背景　　传统模式的空调中单向的控制、可视范围内的短距离控制和独立控制等严重滞后于目前的电子信息技术的发展。无法实现整

期刊

基于改进遗传算法的电网扩展规划

【摘要】本文给出了基于改进遗传算法的电网扩展规划计算方法。首先，针对电网规划实际问题给出了电网扩展规划的数学模型；其次，简单介绍了遗传算法的基本原理和步骤和采用遗传算法进行电网扩展规划的基本流程；然后，对传统的固定罚因子进行了改进，采用模拟退火罚因子来计算罚函数中的惩罚因子；最后，将改进前和改进后的方法通过仿真分析进行对比，结果表明改进后的方法在收敛速度和最优解均值都更加良好。　　【关键词】遗传算

期刊

在用传动设备轴承及振动设备筛网材料的使用状况及改进

摘要：液下泵叶轮轴承连接方式及其下端轴承的改进；振动筛网材料的换型；　　主题词：传动设备的叶轮、轴承；振动设备的筛网材质；改进　　【中图分类号】TL362+.6　　我公司为化工企业，生产中的介质包括蒸汽、含钙高浓液体及含钙低浓液体，成品片状和粒状氯化钙。工况相对较为恶劣，对在用设备的耐温、抗磨、抗腐蚀性、承载能力要求较高。随着生产的发展，对环境保护和安全的要求和标准越来越高，为了确保生产环保的无污

期刊

浅谈本质安全型矿井建设中的影响因素及对策研究

摘要：本文主要是对结合自身的工作经验，对本质安全型矿井建设中的影响因素及对策做了分析。　　关键词：安全型矿井；主要因素；对策研究　　中图分类号： TD175　　在中国平煤神马集团公司决策层的正确领导下，广大干部职工以科学发展观为指引，始终坚持“安全第一、预防为主、综合治理、总体推进”的方针，建立健全各项安全管理制度，坚持管理、装备、培训并重的原则，以“三基三抓一追究”为主线，狠抓“五个到位”，生

期刊

基于因子分析的葡萄等级综合评判模型

其他学术论文