基于数据挖掘的葡萄酒质量鉴别研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:klammj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国既是世界第一大酒饮生产国,也是最大的饮酒消费市场。随着信息时代的不断发展和进步,葡萄酒产业也在逐步进入自动信息化。为了进一步提高我国葡萄酒产品的市场竞争力,在葡萄酒鉴别方面,品酒师人工鉴别已经不能满足今天葡萄酒大量生产的要求,我们要发展研究科学高效的葡萄酒鉴别技术。本文是采用数据挖掘分类算法来对葡萄酒进行质量鉴别研究的,对葡萄酒几种主成分含量进行数据分析来进行对葡萄酒等级分类,力求使葡萄酒质量鉴别做到科学高效。首先本文主要介绍了四种数据挖掘分类算法,分别是KNN分类算法、Logistic回归算法、BP神经网络和支持向量机算法,其中对支持向量机算法进行了时效的优化;由于原始数据不平衡造成局部分类效果不理想的情况,引入SMOTE和随机漫步算法分别进行数据平衡处理,从而有效的提高小数据样本的分类准确率。为了全面优化葡萄酒等级分类效果,得到一种更优的分类器,文中针对现实分类效果最优的SVM分类器和Bagging集成算法进行结合,得到进一步优化的SVM-Bagging集成分类器,使得分类效果得到全面的提高,将SVM分类器和Bagging集成算法结合运用到葡萄酒数据样本鉴别的现实分类问题中也是本文的创新点。从葡萄酒样本数据分类情况来看,各种分类器将原始样本数据进行初步分类,平衡样本数据使得少数类的数据样本从预测精度很低甚至为零提升到和多数类预测精度持平,集成分类器则进一步全面优化分类效果。最终分类器的分类效果和最初相比,分类效果得到很大的优化。
其他文献
目的研究引发体系对合成聚丙烯酰胺相对分子质量的影响.方法从引发机理出发,本文对丙烯酰胺水溶液聚合的5类氧化-还原引发体系进行了研究.探讨了引发剂种类、引发剂浓度、单体浓度
<正>经过十年的努力,京东终于在美国纳斯达克股市成功上市。这家在北京中关村起家的电子商务公司,今年5月22日成为了中国在美国纳斯达克上市的第118家公司。上市当天京东的市
<正>一、困境:"屡查屡犯"成为基层的"牛皮癣"所谓柜员"屡查屡犯",就是基层柜员业务操作中存在的"重复检查、重复整改、重复发生"现象,是银行基层网点普遍存在的"牛皮癣"。以W
中国拥有着五千年的文化积淀,也是四大文明古国之一。在中国古代乐舞就是"诗、乐、舞"三者所结合在一起来表达的,舞在这里面有很重要的地位。中国古典舞讲究的是要达到天人合
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
为反映我国SO2污染的时空演变规律,通过半方差分析和克里格空间内插法,对1990年,1995年和2000年主要城市的SO2年日均浓度进行了空间分析,发现SO2浓度空间分布的结构性在不断
也许,路易斯·布努艾尔自传的突出特点,是你从一个常常扬扬得意,一再重复“感谢上帝,我是个无神论者”这种矛盾说法 的人那里得到的自相矛盾的形象。布努艾尔一贯坚持认为我
期刊
综述了草莓主要病毒病的种类及危害,草莓病毒的脱毒机理、脱毒方法,脱毒苗的鉴定与繁殖,指出了存在问题,对今后的发展方向进行了展望。
民歌是我国传统音乐的重要组成部分。多年来,众多学者对其进行了系统地研究,且不少学者取得了丰厚的成果。本文就二十世纪80年代以来,有关广西壮族民歌研究的部分文献从"人文