Word2vec模型相关论文
随着互联网在社会进程中的快速发展,人们的生活越来越离不开网络,在使用网络的过程中,用户的身份及行为信息也都会被保存在网络上,......
随着信息技术的飞速增长,网络全球化给人们带来的好处也愈加丰富,大量的英文文本携带着众多重要信息出现在种类繁多的资源当中,这......
随着互联网技术的发展,教育理念的变革,用户教育需求的升级和生活方式的转变,中小学在线教育的市场规模大幅度增长.尤其在2020年,......
综合分析企业盈利、销售、信誉等级和信贷政策等数据,利用Word2vec模型对信贷政策偏向性进行分析,利用因子分析法确定银行信贷风险......
现有的英文作文辅助评分系统大多缺乏有效的跑题检测手段,为此提出并设计了一种英文作文跑题智能化检测技术,利用LDA模型获取作文......
伴随着移动互联网的快速发展,社交媒体成为信息传播和流通的主要渠道。社交媒体环境下人人都有麦克风,使得人人都有机会通过社交媒......
根据中国互联网络信息中心发布的《第42次中国互联网络发展状况统计报告》显示,全国网上零售额在2018年上半年已达4.08万亿元,同比......
随着分布式计算、人工智能、云计算等技术的迅速发展,各类网络服务的应用使数据规模与信息体量呈现指数级增长,推荐系统及其相关技......
学位
近年来,随着信息技术的进步与发展,人们获取新闻时讯的方式逐渐由报纸转向网络。由于新闻网站数据流量大,已无法依靠人力的方式撰......
互联网电影评论数据的推荐分析是促进电影业发展的一条新途径,电影评论网站的快速发展也从中起到了积极的推动作用。有效的电影评......
学位
在广告推荐系统中,广告点击率(Click-through Rate,简称CTR)的预测十分重要,基于用户行为的特征交叉对于提高推荐系统点击率预测效......
近年来,聊天机器人在越来越多的领域有了应用,但在实际应用中还有一些障碍需要克服,比如对用户的问句难以有准确的回答。Word2vec......
大数据、云计算、人工智能等新技术的迅速发展,使得互联网应用层出不穷,导致网络数据呈现指数级的增长,大规模数据为各领域发展带......
实现铁路行业海量的铁路科技信息资源有效地组织管理并提供智能化、专业化的检索和服务,已经成为科研人员迫切期望解决的问题.关键......
文章介绍了骚扰短信的研究背景和意义,骚扰短信的基本概念、骚扰短信的特点和分类,分析了国内外骚扰短信识别的现状及发展趋势.介......
通过结合Word2Vec模型、TF-IDF算法和自编码器模型,提出了一种从纯文本文章中提取侧面信息算法(WT-AutoEncoder).首先,爬取相关语......
为了对突发公共事件网络舆情中的公众情感进行分析,本文构建了一种具有较好准确性和可靠性的面向网络舆情分析的领域情感词典。首......
针对现有中文短文本分类算法通常存在特征稀疏、用词不规范和数据海量等问题,提出一种基于Transformer的双向编码器表示(BERT)的中......
现有的配电网恶意控制指令检测方法基于电力系统运行规则,但规则维护困难、规则匹配耗时较长。根据配电网上行测量信息和下行控制......
随着互联网的普及和在线评论平台的流行,在线评论在电子商务平台中扮演着越来越重要的角色,深刻影响着消费者的决策行为和企业的营......
学位
随着互联网应用的普及,公众在网络平台上发表评论,参与社会事件讨论的频率大幅度提高,微博作为国内互联网信息交流与共享的热门社......
随着社交媒体的不断发展,自然语言处理领域中的情感分析正逐渐成为当下的热门研究方向。同时伴随着深度学习的兴起,基于神经网络的......
学位
[目的/意义]从内容层面深入挖掘微博舆情演化过程,根据主题和情绪的相互作用实时预测舆情变化,帮助政府及利益相关者快速地应对舆......
期刊
基于关系触发词与单层门控循环单元模型进行关系抽取,以降低关系抽取模型结构的复杂度,并提高模型的训练效率.通过计算单词的依存......
将word2vec和LDA算法相结合,对文本主题进行提取研究。通过已有的分词工具实现文本分词,提取文本中的词汇;对语料库依据LDA主题模......
随着互联网与信息技术的发展,大数据分析成为目前热门话题之一。大数据分析主要从海量数据中提取有意义的信息作为数据特征,通过分......
学位
自动文本分类技术在文本挖掘、自然语言处理以及机器学习等领域具有重要地位,它为信息检索与文本管理提供了很多便利。近年来随着......
学位
近年来,随着科研工作者人数的迅速增长,学术文献数量与日俱增,这一现象使科研热点的发展趋势无法人为的跟踪和处理。研究科研热点......
针对协同过滤算法存在着数据稀疏性、准确性以及可扩展性问题,提出了一种结合Word2Vec词向量模型和LSH局部敏感哈希的矩阵分解推荐......
提出一种新颖的中文文本分类框架。在该框架中,首先基于Word2Vec构建词向量模型,然后采用分词频文档频率(segmentation term frequ......
电子邮件广泛应用于人们的工作生活中。然而,充斥着虚假信息、恶意软件和营销广告等内容的垃圾邮件也以电子邮件为载体进行传播。......
作为处理文档的重要方式,文本分类在信息处理、新闻分类、舆情监测、文档的自动分类等方面中起着重要作用。最近几十年,机器学习的......
针对语义信息对TextRank的影响,同时考虑新闻标题信息高度浓缩以及关键词的覆盖性与差异性的特点,提出一种新的融合LSTM和LDA差异......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
古诗词是中华优秀传统文化上璀璨的明珠,两千年来,我国优秀诗人辈出,其诗作若满天繁星,内容丰富,影响深远。随着计算机技术的不断......
期刊
通过研究某知名演员偷税漏税事件的舆情走势,给出舆情分析框架,使用Word2vec模型分析人物关系,梳理事件背景,而后使用评论影响力指......
期刊
近年来,微博借助于其自身的草根性、便捷性和对时事的迅速传播性越来越受到大众的欢迎,成为中国大众了解时事和参与热门话题讨论的......
深度学习技术在自然语言处理方向的研究越来越深入,文本分类作为自然语言处理的基础任务之一,已广泛地应用于情感分析、新闻分类等......
随着互联网的高速发展和移动终端的广泛使用,人们在各类社会媒体平台上自由发表评论和表达情感,随时随地分享即时新闻,由此产生了......
由于短文本的文档长度较短,短文本中词语的共现信息非常匮乏,造成短文本信息稀疏性问题。信息稀疏性也成为了传统主题模型在短文本......
由于短文本自身具有词汇个数少且格式不规范的特点,造成神经网络输入矩阵存在特征稀疏、维度过高以及语义特征提取不充分等问题。......
情感分析可以帮助商家了解客户喜好从而生产出满意度更高的商品,也可以监督网上舆论等。为此,基于传统机器学习方法,加入深度学习......
期刊
针对word2vec模型生成的词向量缺乏语境的多义性以及无法创建集外词(OOV)词向量的问题,引入相似信息与word2vec模型相结合,提出wor......
[目的/意义]旨在为时政类新闻关键词抽取提供参考。[方法/过程]基于融合Word2Vec和TextRank算法,在研究时政类新闻文本特征基础上,......
社交媒体平台,如微博、推特等,以其操作便利性、信息共享性、用户互动性、话题丰富性以及更新即时性等特征,吸引着大量的用户在平......
为了让计算机能够对中文文章提取摘要,提出一种中文摘要自动生成算法。该算法基于Gensim自然语言处理框架实现,并在原有的基础上做......