Skip-gram模型相关论文
从社交网络到万维网,网络作为一种重要的数据形式广泛应用于描述现实世界事物之间的复杂关系,有效地从复杂信息网络中挖掘潜在的重......
计算机在处理文本时,在句子和篇章之间存在着明显的语义鸿沟。句群是介于句子和篇章的语法单位,可以有效地降低语义鸿沟带来的不利......
现实生活中许多复杂的系统都能够使用网络来描述,利用复杂网络来抽象复杂系统是常用的研究手段。链路预测作为社会网络的一个重要......
随着互联网技术的快速发展,人们可获取数据的规模和数据的复杂度都在急剧增长。传统的基于特征工程的机器学习方法由于使用具有维......
学位
针对连续时间动态网络的节点分类问题,根据实际网络信息传播特点定义信息传播节点集,改进网络表示学习的节点序列采样策略,并设计......
伴随着互联网行业的迅速发展,在自然语言处理领域中,有效地将输入表示为固定长度的特征向量是机器学习算法中的一个重要研究方向。......
随着恶意代码可视化技术的发展,恶意代码的识别准确率有着明显提升,但仍存在部分变种恶意代码无法识别的问题.基于此,本文提出一种......
文本分类作为互联网文本处理以及文本挖掘的核心,已成为自然语言处理领域的重点研究问题。面对互联网上的各种文本数据呈爆炸式增......
针对miRNA-疾病关联研究中信息使用不充分、过于依赖网络中节点的相似度信息以及预测准确度较低的问题,提出一种基于网络表示学习......
社会网络的巨大规模和复杂结构使得探索整个网络的社区结构的代价变得高昂。因此,着眼于网络局部结构特征的社区查询有着重要的应......
社交媒体中存在着大量的短文本信息流,包含着丰富的用户信息。针对短文本信息流的特点,提出一种新的用户建模的方法。首先将用户发......
目前针对信息网络的研究多数基于同质网络,关于异质信息网络的网络表示学习研究相对较少。为此,提出一种结合不同元路径将异质信息......
针对目前句群划分工作缺乏计算语言学数据支持、忽略篇章衔接词的问题以及当前篇章分析较少研究句群语法单位的现象,提出一种汉语......
针对单一词向量中存在的一词多义和一义多词的问题,以柬语为例提出了一种基于HDP主题模型的主题词向量的构造方法。在单一词向量基......
为解决疾病症状分类时传统特征提取方法存在特征维度较高和数据稀疏的问题,以及结合卷积神经网络(CNN)和支持向量机(SVM)的优势,提......
在文本分类中,基于Word2Vec词向量的文本表示忽略了词语区分文本的能力,设计了一种用TF-IDF加权词向量的卷积神经网络(CNN)文本分......
专业社交媒体中主题图谱的内容包括论坛中的主题及主题之间的关系,其具有挖掘专业产品创新方向、构建专业知识索引等重要应用价值......
传统词向量表示模型往往忽视了单词间的句法形态结构,导致模型预测准确率不高.为此,提出基于fastText模型的词向量表示改进算法.首......
词向量具有良好的语义特性,可用于改善和简化许多自然语言信息处理应用。本研究利用CBOW和Skip-gram两种模型架构在不同数据和不同......
随着互联网的高速发展和移动终端的广泛使用,人们在各类社会媒体平台上自由发表评论和表达情感,随时随地分享即时新闻,由此产生了......
传统的评论选择算法都是基于商品评论的有用性以及评论中所包含的信息量,这就导致所选择出来的评论集冗余度和重复率较高。所以,基......
微博文本长度短,且网络新词层出不穷,使得传统方法在微博事件追踪中效果不够理想。针对该问题,提出一种基于词向量的微博事件追踪方法......
近年来随着移动互联网和电子商务的快速发展,移动上网和网购已经成为人们日常生活的一部分。一些网购企业如淘宝、京东、亚马逊等......
学位
为了更好地对微博进行表示,提高微博情感倾向性识别的准确度,提出一种基于Skip-gram模型的微博情感倾向性分析方法。首先,使用Skip......
期刊
随着时代的发展,各种各样的数据信息不断涌现,如何正确有效地对各种类别信息加以分类、区分,是一个很有研究价值的问题。本文在传统的......
随着互联网的普及与计算技术的飞速发展,网络海量信息数据处理是当今大数据处理的重要研究课题。人们不仅在网络中发布和获取信息,......