基于分离模型的中文关键词提取算法研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wxcheng823
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词提取在自动文摘、信息检索、文本分类、文本聚类等方面具有十分重要的作用。通常所说的关键词实际上有相当一部分是关键的短语和未登录词,而这部分关键词的抽取是十分困难的问题。该文提出将关键词提取分为两个问题进行处理:关键单词提取和关键词串提取,设计了一种基于分离模型的中文关键词提取算法。该算法并针对关键单词提取和关键词串提取这两个问题设计了不同的特征以提高抽取的准确性。实验表明,相对于传统的关键词提取算法,基于分离模型的中文关键词提取算法效果更好。
其他文献
目的观察参麦注射液治疗肺心病的临床疗效.方法将62例肺心病患者随机分成治疗组和对照组,每组各31例,2组常规综合治疗相同,治疗组在综合治疗基础上加用参麦注射液,治疗前后分
目的探讨胃类癌的诊断、病理学特点及治疗选择.方法回顾性分析1989~2003年14年间21例胃类癌的临床资料.结果21例胃类癌中,1例患者术前经胃镜病理证实为胃类癌,有1例出现恶性类
现代社会已然是一个高风险社会刚刚过去的2011年,注定是不平凡的一年。我们不妨来看看国际上的一些“大事件”。1月14日,突尼斯总统本·阿里在民众的示威抗议声中逃往国外,
近几年来,基于短语的统计翻译模型在机器翻译研究中受到普遍关注,并取得了较好的翻译性能。但是,由于目前基于短语的翻译系统在解码时采用精确匹配的策略,常常导致数据稀疏,
城镇调查失业率是准确描述就业形势的关键性指标,可以克服城镇登记失业率严重低估失业水平和失业变动、完全忽视流动人口和隐性失业的缺陷。“十二五”期间,就业促进工作将会被
利用流程模拟软件VMGSim,建立了乙烯装置急冷油的溶剂抽提减黏工艺流程。以正丁烷为溶剂,在溶剂比为1~6、抽提压力3~6MPa、抽提温度120~150℃的条件下,对黏度为968mPa·s(50℃)的
改善国民收入分配,提高城乡中低收入居民收入,是加快经济发展方式转变,建立健全扩大消费需求的长效机制,实现人民群众共享经济社会发展成果的客观要求。普通劳动者收入增长相对缓
目的用高效液相色谱法测定紫杉醇注射液的含量.方法采用高效液相色谱法,色谱柱为BECKMAN C18柱(4.6 mm×15 mm,5 μm),流动相为甲醇-乙腈-水(50∶30∶25),检测波长230 nm
基于事件的抽取式摘要方法一般首先抽取那些描述重要事件的句子,然后把它们重组并生成摘要。该文将事件定义为事件项以及与其关联的命名实体,并聚焦从外部语义资源获取的事件
以端双键聚乙烯为原料,经硼氢化-氧化反应得到了单羟基封端聚乙烯、经巯基-烯点击化学反应得到了含硫单羟基封端聚乙烯、含硫双羟基封端聚乙烯;以环氧基团封端聚乙烯为原料,