基于最大匹配算法的似然导向中文分词方法

来源 :统计与信息论坛 | 被引量 : 0次 | 上传用户:aqxielin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
综合基于规则的分词方法与基于统计的分词方法在分词效果上的优势,提出一种基于最大匹配算法的似然导向中文分词方法。新方法在分词阶段,将训练数据的统计信息融入到基于规则的最大匹配分词算法中,并根据共现性自动识别后续词;在判定阶段,利用具有马尔可夫性的n-gram模型对分词阶段获得的多组分词模式进行判定,并基于最大似然原理确定最优的分词模式以提高分词准确率。实验结果表明,新方法有效提高了分词准确率和召回率,适用于中文文本信息挖掘。
其他文献
在20世纪前期,种族限制性契约是美国白人实行种族隔离最主要的制度性措施。在关于限制性契约的判决中,对"州政府行为"的解释是一个关键,因为联邦宪法第14条修正案的制约对象是
近年来大量研究已经表明幽门螺杆菌(Helicobacter pylori,Hp)可能是种食源性致病菌,而牛、羊乳是其最可能的感染源。食物中较难分离培养出Hp,而聚合酶链式反应相关技术灵敏度
土地利用总体规划会改变用地结构,用地结构变化会影响区域的生态环境,对规划期间各种土地进行生态系统服务价值评估,可以对生态环境的变化做一个量化的对比,能提升规划的决策水平
随着研究深入和发展,愈来愈多的证据表明炎症反应与糖尿病及其并发症关系密切。现在有人认为,糖尿病是一种由细胞因子介导的低度炎症性疾病,其血清炎症标志物水平明显增高。炎症
随着茶叶饮品国际推广的不断深入,越来越多的外国人都开始饮茶,亚洲人地区的人们喜欢喝原滋原味的茶叶,而欧美国家的群众则喜欢喝经过加工之后甜味浓郁的红茶,我国茶企业要面向国
以五邑侨乡文化为例,探讨基于文创设计的艺术设计专业融合实践教学的可行性及教学效果。通过找寻五邑侨乡文创产品现存问题,揭示其根本为地方文创产业与地方高校设计教育关联
城市河道整治工作是实现城市品质提升与可持续发展的重要内容,其难点在于将工程规划与水质目标相呼应。对此,提出了一种正反馈的城市河道整治模式:首先分析城市河道特征;结合
对同一算例边坡,分别采用有限元计算不收敛判据、等效塑性应变或塑性区贯通判据、及特征部位位移(或位移增量)与折减系数关系曲线发生突变判据来确定边坡的整体稳定安全系数,提出
以玉米淀粉为原料,与混合磷酸盐作用,采用湿法工艺制备淀粉磷酸单酯.选取酯化剂用量、pH值、酯化反应温度、反应时间、催化剂用量5个因素为变量,以产物的取代度DS为试验指标,
目的 调查老年急性心律失常患者心理情绪应激源表现。方法 连续选择近一年来前往沈阳市苏家屯区中心医院急诊科就诊的老年急性心律失常患者75例,待他们病情平稳后,进行了“生