贝叶斯方法在文本分类预处理中的应用

来源 :电脑与信息技术 | 被引量 : 0次 | 上传用户:ilqiqi2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本分类预处理过程中,运用贝叶斯方法构造计算文本关键词的条件概率模型,通过计算文本关键词的出现概率将文本映射为关键词的概率向量。在这个过程中贝叶斯方法用于计算条件概率而非分类。
其他文献
最近中石化公司炼油厂在修订成品油计量管理制度过程中,计量交接误差允许值成为争论的焦点.计量交接误差允许值成为了加强成品油管理,提高经济效益的核心内容和指标.按JJF140
空间数据存储管理历来是GIS发展的一个瓶颈。文章首先叙述了空间数据存储管理的历程,并比较了各阶段的优缺点,然后重点分析了空间数据引擎(SDE)这一关键技术。
大学课程表问题是时间表问题之一,也是一个多因素的优化决策问题。文章提出的混合算法,基于动态规划的思想,对大学课程表问题进行分阶段求解,分别采用遗传算法分配时间,采用
目前交管部门的信息化建设已取得显著成效,多年的应用也积累了大量数据,如何利用这些宝贵的信息资源,为管理与决策服务,是交通管理局深入发展的重要研究课题。文章提出了交管
委婉语是一种委曲含蓄、烘托暗示的语言表达方式。委婉语普遍存在于英汉民族的文化中,并反映在英汉语言中,它体现了语言与社会文化的相互关系。从社会文化心理学角度探讨了委
我国知识产权领域存在制度治理主体单一,知识产权行政管理机构重叠、管理效率低下,管理部门职能划分不清晰,管理机关多元化等问题,且知识产权法律体系中部门立法缺乏统一性和
在扩展Petri网基础上提出了一种新的文本分类模型.基本思想是利用定性映射方法扩展Petri网系统,利用状态方程进行推理,使文本分类更接近于人类思维判断过程,并给出了分类算法
以属性论为理论依据,分析了个性数据属性与属性重心剖分模型的关系,在属性线性坐标系中表示数据属性集对象重心点,从而得到聚类程度函数和聚类算法.该模型有效地描述了个性化
依照物体的电磁辐射特点,建立了针对不同地物的毫米波辐射特性数据库.该数据库可为仿真系统提供定标数据,可保存各类分析和计算结果.