基于深度学习的中文短语复述抽取技术研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:guansea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复述抽取是自然语言处理任务中的一个重要分支,高质量的复述资源对于提升信息检索、问答系统、机器翻译等任务的效果有很大帮助。该文将任务限定在中文短语复述抽取,提出了基于2BiLSTM+CNN+CRF的序列标注模型,用于单语中文语料短语划分,通过若干过滤规则获取优质中文短语。之后又提出了基于表示学习的候选复述获取方法,通过BattRAE模型获取中文短语向量表示,并使用余弦相似度计算短语间的语义距离。该文根据语义距离对短语对进行过滤,将语义距离相近的短语视作候选的复述短语,再通过规则过滤掉错误的候选复述。在最后的
其他文献
“数学教学活动必须建立在学生的认知发展水平和已有的知识经验基础上。教师应激发学生的学习积极性,向学生提供充分从事数学活动的机会,帮助他们在自主探索和合作交流的过程中
随着通讯网络技术的飞速发展,当今中国悄然进入了一个“微”时代,不知不觉中出现了众多的“微”群落——微博、微信、微访谈、微电影、微小说等。而学校的教育教学活动也不例外
小学阶段正是书法教育的黄金时段,教师应抓住这一关键时期,采取行之有效的策略,提高书法课堂教学实效,使学生有一手规范、端正、美观的好字,为孩子的一生奠定基础。
文本分类是自然语言处理领域的核心任务之一,深度学习的发展给文本分类带来更广阔的发展前景。针对当前基于深度学习的文本分类方法在长文本分类中的优势和不足,该文提出一种