一种基于大规模语料的新词识别方法

来源 :计算机工程与应用 | 被引量 : 7次 | 上传用户:jasongoes
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于大规模语料的新词识别方法,在重复串统计的基础上,结合分析不同串的外部环境和内部构成,依次判断上下文邻接种类,首尾单字位置成词概率以及双字耦合度等语言特征,分别过滤得到新词。通过在不同规模的语料上实验发现,此方法可行有效,能够应用到词典编撰,术语提取等领域。
其他文献
在我国“一带一路”和经济“新常态”等经济发展战略布局以及国内外环境的巨大变化等背景下,世界各国经济联系日益增强,区域经济一体化已成为全球经济发展和区域空间结构演变
为提升高素质技能人才培养质量,服务徐工集团产业升级和一带一路倡议,我校开展了现代学徒制海外工程师的培养探索.以徐工集团现代学徒制海外班为例通过"学校—基地轮训—弹性
中国特色高水平高等职业学校和专业建设计划的启动和实施,对高职院校干部队伍建设提出了新要求,即高职院校中层干部要强政治、明大势、懂产业、重质量.但当前部分高职院校干
包装设计是一门综合运用自然科学和美学知识,实现流通商品保护,并促进产品销售的专业学科。传统设计案例多围绕产品流通保护功能的实现,在品牌表现力及消费者吸引力方面展现