基于统计特征的Quality Phrase挖掘方法

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户:chrisevenk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Quality Phrase挖掘是从文本语料库中提取有意义短语的过程,是文档摘要、信息检索等任务的基础。然而现有的无监督短语挖掘方法存在候选短语质量不高、Quality Phrase的特征权重平均分配的问题。本文提出基于统计特征的Quality Phrase挖掘方法,将频繁N-Gram挖掘、多词短语组合性约束及单词短语拼写检查相结合,保证了候选短语的质量;引入公共知识库对候选短语添加类别标签,实现了Quality Phrase特征权重的分配,并考虑特征之间相互影响设置惩罚因子调整权重比例;按照候选短语的特
其他文献
目的:分析Alcock阴部神经阻滞在无痛人流术中的应用效果。方法:选取2014年1月~2018年6月期间,于某院接受无痛人流术的患者92例,以随机方式将其分为参照组与研究组各46例。参
目的观察高频振荡叠加常频通气治疗重度新生儿呼吸窘迫综合征(NRDS)的效果及并发症情况。方法重度NRDS患儿67例,随机分为高频振荡叠加常频通气组(H+C组)和高频振荡通气组(H组
目的探讨自身抗体相关性先天性心脏传导阻滞(ACHB)的有效诊断及治疗方法。方法对1例双胞胎之一ACHB患儿的临床资料作回顾性分析。结果双胞胎之一患儿在母亲孕期及出生后心率
心血管疾病是当今人类死亡的主要原因之一。本文基于改进的残差网络对心电信号进行识别,并将改进后的残差网络和空洞卷积进行结合,特征提取时保持局部信息不变的同时尽可能地