基于统计特征的Quality Phrase挖掘方法

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户：chrisevenk

【摘要】

：

Quality Phrase挖掘是从文本语料库中提取有意义短语的过程,是文档摘要、信息检索等任务的基础。然而现有的无监督短语挖掘方法存在候选短语质量不高、Quality Phrase的特征

【作者】

：

杨欢欢赵书良李文斌武永亮田国强

【机构】

：

河北师范大学计算机与网络空间安全学院,河北师范大学河北省供应链大数据分析与数据安全工程研究中心,河北师范大学河北省网络与信息安全重点实验室,河北地质大学信息工程学院,河北师范大学数学科学学院

【出处】

：

数据采集与处理

【发表日期】

：

2020年3期

【关键词】

：

文本挖掘 Quality Phrase 统计特征候选短语特征加权 text miningQuality Phrasestatistic featuresca

【基金项目】

：

国家社会科学基金重大(13&ZD091,18ZDA200)资助项目

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Quality Phrase挖掘是从文本语料库中提取有意义短语的过程,是文档摘要、信息检索等任务的基础。然而现有的无监督短语挖掘方法存在候选短语质量不高、Quality Phrase的特征权重平均分配的问题。本文提出基于统计特征的Quality Phrase挖掘方法,将频繁N-Gram挖掘、多词短语组合性约束及单词短语拼写检查相结合,保证了候选短语的质量;引入公共知识库对候选短语添加类别标签,实现了Quality Phrase特征权重的分配,并考虑特征之间相互影响设置惩罚因子调整权重比例;按照候选短语的特

其他文献

Alcock阴部神经阻滞在无痛人流术中的应用

目的:分析Alcock阴部神经阻滞在无痛人流术中的应用效果。方法:选取2014年1月~2018年6月期间,于某院接受无痛人流术的患者92例,以随机方式将其分为参照组与研究组各46例。参

期刊

Alcock阴部神经阻滞无痛人流术麻醉效果Alcock pudendal nerve blockpainless abortionanesthesia e

高频振荡叠加常频通气治疗重度新生儿呼吸窘迫综合征疗效及并发症观察

目的观察高频振荡叠加常频通气治疗重度新生儿呼吸窘迫综合征(NRDS)的效果及并发症情况。方法重度NRDS患儿67例,随机分为高频振荡叠加常频通气组(H+C组)和高频振荡通气组(H组

期刊

机械通气高频振荡通气常频通气新生儿呼吸窘迫综合征机械通气并发症

双胞胎之一自身抗体相关性先天性心脏传导阻滞的诊治(附1例报告)

目的探讨自身抗体相关性先天性心脏传导阻滞(ACHB)的有效诊断及治疗方法。方法对1例双胞胎之一ACHB患儿的临床资料作回顾性分析。结果双胞胎之一患儿在母亲孕期及出生后心率

期刊

心脏传导阻滞先天性心脏传导阻滞自身抗体相关性先天性心脏传导阻滞抗SSA/Ro-60抗体抗SSB/Ro-52抗体新生儿狼疮异卵双胞胎

基于改进残差网络对心电信号的识别

心血管疾病是当今人类死亡的主要原因之一。本文基于改进的残差网络对心电信号进行识别,并将改进后的残差网络和空洞卷积进行结合,特征提取时保持局部信息不变的同时尽可能地

期刊

心律失常信号空洞卷积残差网络MIT⁃BIHSoftmaxarrhythmia signaldilated convolutionresidual ne

基于统计特征的Quality Phrase挖掘方法

其他学术论文