中文短文本相关论文
依存句法分析旨在从语言学的角度分析句子的句法结构。现有的研究表明,将这种类似于图结构的数据与图卷积神经网络(Graph Convolutio......
随着网络的快速发展,以及互联网+经济模式的大力推行,人类日常生活中的信息大规模的向网络迁移,而在这些信息中含有大量的短文本信......
实体链接是加强语义理解和连接知识信息与文本的有效方法,但目前多数模型对上下文语境的精准理解受限于文本长度,面向短文本的实体......
随着互联网的迅速发展,网上生活已经成为了人们必生活中不可少的一部分。互联网上的人们使用的信息很多是以短文本的形式存在的。短......
文本聚类主要目的是以无监督机器学习方式将文本划分为多个类,每个类包含相似度较高的文本,类与类之间有较低相似度。中文短文本则是......
当前,短信、微博、即时消息(Instant Message, IM)和在线聊天(Internet Relay Chat, IRC)等信息增长迅猛,如何对这些短文本进行分......
随着互联网科技的蓬勃发展,微博微信等即时通讯工具随之出现,由于其具有简单易用,传播迅速等特点,日益成为大众日常重要的沟通交流......
随着互联网的高速发展,以短文本形式出现的信息呈现爆炸式的增长,比如在线即时聊天信息、手机简讯、微博、短文本评论及电子商务网站......
文本分类是指在给定的分类体系下,根据文本的内容自动识别文本类别的过程。它是文本挖掘的基础与核心。从国内外该课题的研究分析可......
在如今互联网飞速发展的时代,众多网民通过网络平台发表意见或分享自己的情绪,其中产生的文本信息往往是比较简短的且带有主观情感......
为更好地挖掘文本信息,研究了将两步策略用于中文短文本分类的3个关键问题,提出了基于组合朴素贝叶斯(NB)和K近邻(KNN)分类器的两......
随着信息化进程不断深入,人们对自然语言语义理解系统的需求也愈加迫切。现阶段,在命名实体基础上展开分析和研究,成为语义研究中......
中文短文本聚合的目的是将两个数据集中属于同一对象的短文本信息进行匹配关联,同时要避免匹配不属于同一对象的短文本信息,这项研究......
准确地获取用户偏好信息是个性化推荐的基础,而关键词提取技术则是用户偏好信息提取技术的关键。区别于传统的对整个网页页面进行关......
在自然语言处理领域中,随着网络的普及,研究者对中文短文本语义相似度计算方法的关注越来越多。中文是表意的文字,相对英文,中文没......
当前互联网上的文本多以短文本为主,如微信、微博等。短文本具有特征稀疏、表达不规范、表达情绪多样等特点。传统的针对长文本情......
针对中文短文本缺乏上下文信息导致的语义模糊从而存在的特征稀疏问题,提出了一种融合卷积神经网络和多头自注意力机制(CNN-MHA)的......
在中文短文本情感分析的特征提取中,词频逆文本频率指数算法TF-IDF存在特征词分布计算片面性的缺陷,信息增益算法IG不能很好地提取......
针对中文短文本冗余问题,提出了有效的去重算法框架。考虑到短文本海量性和简短性的特点,以及中文与英文之间的区别,引入了Bloom F......
针对中文语言本身特点,以及传统文本分类方法不能有效应对短文本分类的问题,本文构建了基于LSTM-CNN的中文短文本分类模型。该模型......
为使用户能够更快从海量的互联网信息中获得自己想要的信息,需要利用自动摘要技术给这些短文本添加简短的摘要,提出采用深度学习结......
海量互联网数据的异构、多源和异质等问题使得高效、精准的知识获取成为巨大的挑战。关系抽取是自然语言处理中的一项基础性任务,......
中文短文本语义相似度计算方法研究是自然语言处理技术的基础。现有方法存在以下问题:在字词语义表征层面,中文字、词通常具有多个......
随着互联网技术的快速发展与普及,用户对互联网发展的参与程度大大提高,各种各样的互联网社交应用,如微博、微信、QQ等,每天产生的......
移动互联网的蓬勃发展导致了互联网中聚集了海量的带有主观性信息的短文本,其中包含的大量的观点态度和舆论动向都具有不可估量的......
近年来随着互联网的快速发展,网络信息呈现出飞速增长的趋势,其主要表现形式为短文本。如何从中找到有价值的信息并对其进行准确分......