面向专利文献的中文分词技术的研究

来源 :第五届全国信息检索学术会议CCIR2009 | 被引量 : 0次 | 上传用户：wf136156491

【摘要】

：

针对专利文献的特点，本文提出了一种基于统计和规则相结合的多策略分词方法。该方法利用文献中潜在的切分标记，结合切分文本的上下文信息进行最大概率分词，并利用术语前后缀规律

【作者】

：

刘东生尹宝生张桂平徐立军苗雪雷

【机构】

：

沈阳航空工业学院自然语言处理研究室,沈阳 110034

【出处】

：

第五届全国信息检索学术会议CCIR2009

【发表日期】

：

2009年期

【关键词】

：

专利文献中文上下文信息未登录词切分概率分词文本识别问题分词方法前后缀后处理多策略语料统计术语实验规律测试标记

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对专利文献的特点，本文提出了一种基于统计和规则相结合的多策略分词方法。该方法利用文献中潜在的切分标记，结合切分文本的上下文信息进行最大概率分词，并利用术语前后缀规律进行后处理。该方法充分利用了从大规模语料中获取的全局信息和切分文本的上下文信息，有效地解决了专利分词中未登录词难以识别问题。实验结果表明，本文方法在封闭和开放测试下分别取得了较好的结果，对未登录词的识别也有很好的效果。

其他文献

在自力更生、自主创新的道路上不断开拓中国特色核武器科技事业的光辉前景

核武器是成千上万人参与的体现国家意志的核心重大工程。60年代，为实现第一颗原子弹爆炸成功，除了中国工程物理研究院主体单位，当时有20多个部委、20多个省市、1000多家单位参与

会议

自主创新道路中国特色核武器科技事业经验和启示重大工程中华民族物理研究武器研制国家意志原子弹创造力人参结晶法宝爆炸

对“两弹一星精神”的几点再思考

开创“两弹一星”事业的那段历史，已经过去几十年了，但至今，这座事业的丰碑仍然高耸在共和国的发展史上，开创者的动人事迹仍然不断被人们传颂，他们创造的崇高的价值观日益显现出其

会议

两弹一星精神价值观科学发展

“两弹一星”伟大工程的历史贡献及其战略启示

“两弹一星”是20世纪中叶我国国防尖端科技领域取得的巨大成就，是中华人民共和国发展史上具有里程碑意义的惊世创举。本文介绍了“两弹一星”工程的发展过程，浅谈了“两弹一星

会议

两弹一星工程国防尖端科技民族振兴和平崛起

安贫煮字一谢雍记天津著名书家谢学鉴

谢雍是他的笔名,实名叫谢学鉴。他不仅是书法家,而且在篆刻、绘画、诗词楹联、根雕、赏石等诸多方面都有属于自己的骄人成就。谢雍多才,在书法界属于书品人品皆有口碑的人物,

期刊

出版作品赏石书品书协中国书法家协会中国美术家协会书法作品交流展印社当代书法

“两弹一星”对我国战略威慑力量建设发展的经验启示

“两弹一星”的研制成功是我国20世纪最辉煌的历史成就之一，使中国一举成为世界上少数几个独立掌握核技术和空间技术的国家。以“两弹一星”为代表的尖端战略武器装备，使我国在

会议

两弹一星战略威慑力量建设武器装备历史成就空间技术科技领域经验启示国际影响国际地位发展途径发展思路核技术中国盘活军事国家创新

国防科技和武器装备建设事业的杰出领导者张爱萍

张爱萍同志是我国国防科技事业的杰出领导者，他呕心沥血铸利剑，为发展以“两弹一星”为主要标志的国防尖端科技事业，建立国防工业体系，提高我军武器装备的现代化水平，付出了大量心

会议

国防科技武器装备张爱萍

深切怀念聂荣臻元帅进一步弘扬“两弹一星”精神

本文介绍了高度重视科学技术在社会主义建设事业中的关键作用、参与组织领导制定和实施了我国第一个科技发展规划《1956-1967年科学技术发展远景规划纲要》，全面推进我国科学

会议

聂荣臻元帅两弹一星精神科技发展规划

深切怀念新中国科技事业的伟大奠基人周恩来

伟大的无产阶级革命家周恩来同志为我国的革命和建设事业建立了丰功伟绩。在我国的科技事业中，同样凝结着周恩来的辛勤劳动和卓越智慧，他是新中国科学技术事业的伟大奠基人。本

会议

周恩来科技事业社会主义建设

基于搜索引擎的人物社会关系抽取研究

人物关系抽取是实体关系抽取研究的一个重要分支。本文提出了一种基于搜索引擎的人物社会关系抽取方法。该方法首先将人物关系特征词与测试集人名一起作为组合关键词提交到搜

会议

中国氮肥工业协会名誉理事长刘淑兰

目前,中国硝酸硝铵产能和产量已经自给有余,且在生产技术、安全管理方面逐渐成熟,但整个行业发展中存在着产能过剩、创新能力不强问题。未来硝酸硝铵应发挥自身优势,通过发展

期刊

氮肥工业刘淑兰产能过剩硝铵农业应用生产技术生存发展空间水肥一体化配肥

面向专利文献的中文分词技术的研究

与本文相关的学术论文