基于粗分和词性标注的中文分词方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：hguhV

【摘要】

：

中文分词是中文信息处理的重要内容之一。在基于最大匹配和歧义检测的粗分方法获取中文粗分结果集上,根据隐马尔可夫模型标注词性,通过Viterbi算法对每个中文分词的粗分进行

【作者】

：

姜芳李国和岳翔吴卫江洪云峰刘智渊程远

【机构】

：

中国石油大学（北京）地球物理与信息工程学院,中国石油大学（北京）油气数据挖掘北京市重点实验室,石大兆信数字身份管理与物联网技术研究院,中海油研究总院信息数据中心

【出处】

：

计算机工程与应用

【发表日期】

：

2015年06期

【关键词】

：

分词词性标注隐马尔可夫模型 Viterbi算法

【基金项目】

：

国家高新技术研究发展计划(No.2009AA062802);国家自然科学基金(No.60473125);中国石油(CNPC)石油科技中青年创新基金(No.05E7013);国家重大专项子课题(No.G5800-08-ZS-WX)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

中文分词是中文信息处理的重要内容之一。在基于最大匹配和歧义检测的粗分方法获取中文粗分结果集上,根据隐马尔可夫模型标注词性,通过Viterbi算法对每个中文分词的粗分进行词性标注。通过定义最优分词粗分的评估函数对每个粗分的词性标注进行粗分评估,获取最优的粗分为最终分词。通过实验对比,证明基于粗分和词性标注的中文分词方法具有良好的分词效果。

其他文献

水质监测的重要指示生物——毛翅目幼虫

通过对松花江、嫩江两大河流中毛翅目幼虫调查 ,共采集到毛翅目幼虫40种 ,它们隶属14科。同时对毛翅目幼虫作为水质评价的重要指标生物的意义进行了讨论

期刊

毛翅目幼虫指示生物生物监测松花江嫩江

改进的模糊C-均值聚类算法

为了克服模糊C-均值(FCM)聚类算法易陷入局部极小值和对初始值敏感的缺点,提出了一种基于改进量子蚁群的模糊聚类算法。将量子计算原理和蚁群算法相结合来改进FCM算法。初期

期刊

聚类分析模糊C-均值聚类蚁群算法量子计算

基于文献计量的国内知识地图研究述评

运用文献计量结合内容分析的方法,从研究阶段和研究力量两个方面分析了国内知识地图的研究现状;然后从理论研究、技术研究、应用研究三个方面归纳了研究论文的主要内容;最后

期刊

知识地图文献计量主题分析理论研究技术研究应用研究

三头梯形丝锥一次攻成

<正>我厂生产的起动机中有个零件,其内孔有多头梯形内螺纹如图1所示.多头梯形内螺纹的切削,我厂过去的加工方法是放在技术革命中自己制成的半自动内螺旋槽切削机床上加工的.

期刊

梯形内螺纹内螺旋槽

校企合作长效机制的探索与实践——基于长安汽车培训中心建设

<正>校企合作是学校与企业建立的一种合作模式。当前职业教育院校为谋求自身发展,抓好教育质量,采取与企业合作的方式,有针对性地为企业、为社会培养人才。而职业教育就是为

期刊

校企合作合作模式培训中心长安汽车汽车工程系兰州石化职业技术学院长效机制

汽车前照灯智能自适应照明

从AFS的性能特点入手,通过核心芯片的选用、控制系统的构建,概要介绍新型的汽车前照灯照明系统设计的要点。重点阐述汽车前照灯照明系统架构技术方案的确定,介绍具有自适应功

期刊

汽车前照灯AFS智能自适应照明偏转角注视点

关注炼能总体过剩背后的不过剩—中石化经济技术研究院原副总工程师朱和访谈

<正>今年以来,国内炼油能力过剩的问题在行业内外引发热议,受到各方关注,"能力确已过剩,需要努力化解"已成为业界的共识。但我们又应该如何客观全面而又较为深入地看清这一问

期刊

炼油能力区域分布技术经济指标核心竞争力盈利能力万吨级石化行业炼油企业副总工程师炼化一体化研究院产能过剩

奔驰轿车3.5L-V6汽油机解析(五)

<正>(接上期)奔驰公司采用缸内汽油直接喷射燃烧过程,成功地在批量生产条件下实现了理论上预测的这种新技术的潜力。直喷式汽油机从第一代发展到第二代,即从壁面引导燃烧过程

期刊

汽油机燃油消耗奔驰轿车相位调节器压电喷油器

通过革命而进步的民国书法

民国书法经历了帖学、碑学、碑帖兼容三个规范的竞争,最后碑帖兼容的规范取得了革命性的胜利。它通过革命而进步,不仅体现在规范变迁的进步,还体现在规范常态发展中书法知识

期刊

革命民国书法规范

燃料电池汽车正面碰撞安全性研究

燃料电池汽车在结构上有别于传统汽车,其碰撞安全性尤应关注。文中重点对燃料电池汽车结构特点进行研究,建立燃料电池汽车正面碰撞有限元模型,运用LS-DYNA仿真确定车辆安全性

期刊

燃料电池汽车碰撞安全性正面碰撞试验

基于粗分和词性标注的中文分词方法

与本文相关的学术论文