基于隐Markov模型的文本分类

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：gu999

【摘要】

：

把基于序列模型的隐Markov模型引入文本分类领域。把待分类文本描述成一系列状态演化的隐Markov过程，其中状态以特定的概率产生代表文本的特征项。用序列模式来描述文本类，文本

【作者】

：

罗双虎欧阳为民

【机构】

：

上海大学计算机科学与工程学院

【出处】

：

计算机工程与应用

【发表日期】

：

2007年30期

【关键词】

：

隐马尔可夫文本分类序列模型 Hidden Markov Models（HMM） text categorization sequence model

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

把基于序列模型的隐Markov模型引入文本分类领域。把待分类文本描述成一系列状态演化的隐Markov过程，其中状态以特定的概率产生代表文本的特征项。用序列模式来描述文本类，文本序列通过与隐Markov模型的匹配，求出其对应状态序列和最大输出概率。比较各个文本类的结果，达到文本分类的目的。最后通过和简单向量算法，KNN，Naive Bayes分类算法的比较，说明本算法的在文本分类中的成功应用。

其他文献

山萘高产栽培技术简介

摘要山萘即沙姜，原产于非洲及亚洲热带，我国南至西南部均有分布，喜欢生长于山坡上、林木下及草丛中，是多年生草本姜科块茎植物，根茎块状，其性味功效犹如生姜，俗称为沙姜。沙姜不耐寒，喜欢阴凉、温暖和湿润气候，对土壤要求不严。沙姜用途广泛，根茎药用，既是人们食用的调味佳品，也是食品工业、医药工业重要原料。沙姜温中、消食、止痛，主治心膜冷痛、停食不化、跌打损伤和牙痛，用于胸隔胀痛、脘膜冷痛、消化不良。当

期刊

山萘沙姜块根种植管理病虫害防治

信号Ⅰ、Ⅱ路电源监控记录器研发与应用

电气集中设备Ⅰ、Ⅱ路电源是否可靠直接关系到铁路行车的安全。强调了信号Ⅰ、Ⅱ路电源监控记录器研制的必要性,介绍该记录器的工作原理和现场应用情况。 Electrical concen

期刊

铁路信号电源监控设备研发应用

生产调度优化问题文化进化算法研究

许多生产调度优化问题属于NP-hard问题，其求解通常采用智能启发式算法。基于文化算法及文化进化思想设计的文化进化算法，通过上层文化空间的经验知识指导下层个体进化搜索的方

期刊

调度优化问题文化进化算法FLOWshop调度问题scheduling optimization problems Cultural Evolution

曲线桥顶推施工技术

结合哈尔滨市某立交桥连续钢箱梁顶推施工实践,概述了曲线段顶推施工中平台、临时墩、导梁等辅助设施的设置原则,着重介绍了曲线段顶推、落梁的控制措施.

期刊

曲线桥顶推施工连续梁落梁控制导梁施工墩顶水平力thrusting method curved bridge continuous girder

基层气象台站管理浅析

摘要基层气象台站，担负着地区性气象播报、气象管理工作。因此，不管是基层气象台站的管理人员或从业人员，都是处在业务第一线的人员，对于基本的气象业务及气象服务等工作的了解也相对到位。但在管理方面，依旧暴露出较多问题，这些问题都会影响基层气象台站的管理以及发展。结合贵州省黎平县气象局管理实际呈现出的特点进行简单分析，分别从日常管理及科研管理两个方面阐述基层气象台站的管理方法与原则对策，以期为相关的基

期刊

基层气象台站管理方法

湖南形成“田”字型铁路网娄底成为交通枢纽

【正】2004年4月18日,洛湛铁路娄底至益阳段正式通车运营,这标志着三湘人民翘首期盼多年的"田"字型铁路网终于在湖南的交通版图上尘埃落定。洛湛铁路北起河南洛阳,南至广东

期刊

湖南铁路网交通枢纽铁路交通

福建·福安穆云刺葡萄采摘游红红火火

本刊讯 8月30日，福安市刺葡萄主产区穆云畲族乡举办了第六届刺葡萄采摘节，吸引了众多游客前来观赏，并体验采摘乐趣。据悉，近期，随着刺葡萄的陆续成熟上市，穆云畲族乡到处果飘香、歌

期刊

刺葡萄福安市采摘福建栽培历史文化底蕴种植面积畲族

一种基于双带外信号节省能耗的Ad—Hoc接入协议

Ad—Hoc在MAC层有两种节约能耗策略。一种是能量节省机制，它允许节点在不活动时候关闭电源进入睡眠状态，从而节省能耗；另一种是功率控制机制，它能通过减小发射功率节约能耗。结合

期刊

功率控制能量节省MAC协议power controlpower saving MAC protocol

湖北·当阳无核椪柑价高

本刊讯（李德雄,特约通讯员谢合平）2015年,当阳市无核椪柑喜获丰收,总产达到5万多t。目前该市种植面积达6 000 hm^2以上的种植大户生产的无核椪柑已基本被订购,订购均价达到2.10

期刊

无核椪柑湖北种植面积种植大户当阳市优质果订购无籽

公式法模糊决策的模糊控制器及其应用研究

针对火电厂主汽温系统的大滞后、大惯性、非线性等特点,在对龙升照等提出的解析式类型控制规则进行改进的基础上,提出了一种新型的模糊控制策略,采用优选法进行参数的寻优,克

期刊

主汽温模糊控制优选法偏差积分main steam temperaturefuzzy controloptimization methoderror

基于隐Markov模型的文本分类

与本文相关的学术论文