基于信息熵的粗糙集理论的研究和应用

来源 :安徽大学 | 被引量 : 0次 | 上传用户:lezhe14790511
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息资源的日益庞大,信息传输速度的迅速加快,互联网给人们提供的服务途径更加方便,内容不断丰富,例如人们可以在网络上发表博客,将自己知道的有趣的事情和所有的博友分享,也可以对其他博友分享的东西进行评论,发表自己的意见和见解;可以在网络上进行交易,买卖东西,甚至于对交易的产品质量、价格、买卖双方的诚信度进行评价。由于网络活动自己的虚拟性的特点,无论我们是在网络上分享奇闻异事还是在网络上进行交易活动,人们都看不到事情或是事物真实的存在,只能看到事物或事情在网络上的描述性的存在。为了更加加深对这种网络存在的事情或事物的认识,人们更多的是倾向于通过参照网络上现有的对这种网络存在事物或事情的评价来多方位、多角度的认识和了解这类网络存在事物的各个方面的性质,例如之前所介绍的网络奇闻异事的真实性、网络交易产品的质量、性价比、交易双发的诚信度等。但是由于网络评论仁者见仁智者见智,对于同一事物,人们可能会形成不同的评论,但结果不外乎两个,正面或是负面。如何可以通过计算机系统的对这些网络评论进行分析,判断人们对事物的评价倾向,即判断这些中文文本的情感倾向,对网络使用者来说,无疑是具有巨大的价值的。文本倾向性分析属于计算语言学的范畴。在计算语言学以及相关领域,对主观性信息的分析和提取的关注目前的研究并不是很多,尚处于起步阶段,还有很多问题需要进行全面的探索。这项研究涉及到人工智能,机器学习,信息检索,数据挖掘等多方面的基础研究,因此,文本倾向性的分析也具有重要的学术研究价值。本文主要对网络评论语句的特征形式进行分析,结合粗糙集理论中的属性约减、信息熵、模式匹配算法对网络评论语句进行预处理,提出了一种基于信息熵的粗糙约理论在中文文本处理中的应用,对中文文本的倾向进行判断,并通过实验验证了这种判断的可行性。
其他文献
节能减排、产品质量和安全追溯等战略,对开放环境下全供应链信息共享提出需求。论文基于课题组前期研究成果——ORFP体系,以离散制造业为背景,研究企业信息服务模型及事件检测方
蛋白质是生物功能的主要体现者和执行者,正是它们之间的相互作用实现了生物体的功能。对蛋白质和蛋白质相互作用的研究,不但有助于蛋白质功能分析、生命活动机制的理解,而且
随着信息技术的发展,用户获取到的信息量不断地增加,其中大部分是文本类型的数据,一种高效地管理并有效地利用这些无序数据的技术—文本挖掘技术在这几十年来逐渐地成为一个
随着图像采集技术的发展,人们可获得分辨率越来越高的图像,高效地提取高分辨率图像中大量可辨识信息对图像工程应用有重要意义。传统的多分辨率图像锥采用低通滤波技术,分割
粗糙集属性约简通常反映的是信息表的本质信息,它是粗糙集理论的核心内容。通常情况下,信息系统的约简是不唯一的,人们希望找到一个包含最少属性的约简,即最小约简。因此,研
近年来,由于生产生活水平的不断提高和计算机在各行各业的应用技术的高速发展,人们获取数据的能力已经大大的提高,获取数据的渠道也急剧增加。随着信息管理与信息处理系统的
在规模庞大的制造业领域,由于受思维惯性、管理成本和专业人才的制约,会计信息化尤其是财务预算信息化水平明显滞后,许多中小企业使用电子表格、普通数据库软件编制财务预算,
粒计算是人工智能领域新兴起的一门学科,是一种新的数学工具。它主要有三大理论:基于模糊逻辑的粒计算理论、基于粗糙集的粒计算理论和基于商空间的粒计算理论。基于粒计算方
安全多方计算(Secure Multi-Party Computation,简称SMC)问题最早由A. C. Yao于上世纪80年代初提出,是研究在一个互不信任的网络环境中,两个或多个参与方合作计算一个事先约
提出了一种实时的人体模型自动绑定和卡通运动的生成算法。在构建人体模型后,先用骨骼嵌入方法自动抽取模型的骨骼,再利用热量平衡原理对抽取的骨骼模型进行自动绑定。为了生