基于信息论的文本分类模型

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:aquarius215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从信息论的角度,提出了一种新的文本分类模型。该模型以文本提供的关于类别的信息作为分类依据,从另一个角度来思考文本分类问题。从实用性的角度来看,该模型与传统的朴素贝叶斯模型和基于KL距离的中心向量法具有一定的关系,并给出了证明。根据广义信息论的基本概念,又对此模型进行推广,提出了特征权重的概念,可以通过修正特征权重来修正文本分类模型,为成功解决文本分类模型的修正问题提供了理论基础。
其他文献
<正>早期大肠癌是指癌组织局限于黏膜及黏膜下层,而不论其大小及是否有淋巴结转移。大肠癌癌前病变包括腺瘤、腺瘤病(家族性腺瘤性息肉病及非家族性腺瘤性息肉病)、炎症性肠
<正>白塞氏病又称白塞氏综合征,是一种原因不明,以小血管炎为病理基础的慢性进行性多系统疾病,其中以口腔溃疡、生殖器溃疡、皮肤及眼部损害为常见,关节、心血管、消化道、神
目的观察异维A酸对原发性皮肤淀粉样变(PCA)的治疗作用,探讨治疗原发性皮肤淀粉样变的有效方法。方法原发性皮肤淀粉样变患者32例(男性21例,女性11例),均口服异维A酸胶丸10mg
从上世纪80年代至今,国内冠词研究经历了从定性研究向定量研究的转变,从整体研究向局部研究的转变,研究更加全面和细化。主要研究成果显示研究者在研究初期主要是在理论层面
<正>上海自贸区的揭牌,为中国的国际船舶登记制度改革又提供了一次机遇。多年来,过于严格的中国船舶登记制度一直被航运界所诟病,虽经历几次尝试和探索,但总难以跟上国际船舶
目的:初步探索有效能助人者模式培养高职护生护理干预能力应用情况。《内科护理学》课程中开展有效能助人模式的教学活动,以核心胜任能力和解决问题能力的改变、护理技能掌握
修饰否定词的副词"并"与"又"都表示加强否定语气,但是两者的使用条件存在不同。本文试图从语义结构的角度分析二者的差异,并且通过留学生预科汉语教材的对比分析,考察这两个
<正> ·教学目标 1.知识目标记住香港和澳门回归的时间。知道香港和澳门的地位位置、范围和居民组成。理解香港在国际交通、贸易、金融、旅游等方面的重要地位及香港的工业结
同云南省其他旅游区相比,普洱市旅游业发展具有明显的相对优势,但经过多年开发以后依然处于“冷点”状态。普洱市茶产业的快速发展将对其旅游业加快发展产生积极的推动,包括
在美国联邦证据规则发展的历史上,品格证据规则是英美法系国家的一项重要证据规则,同时也是变动最为频繁、引发争议最多的证据规则之一。品格证据作为一种特殊的证据形式,针