隐含狄利克雷分布相关论文
为对网络舆情数据进行主题挖掘与情感分析,以微博某单位招聘热点事件的舆情演变为研究对象,提出了一种融合主题模型和情感分析的LD......
[研究目的]针对交叉性主题探索相关研究在数据处理规模、信息预测功能方面的不足,引入机器学习技术预测交叉性研究主题,以期为探索......
随着旅游服务业蓬勃发展,持续提升客户满意度已成为各大企业管理者关注的发展目标之一,许多学者也深入研究客户满意度影响因素。近......
协同创新模式是当今科技发展的新典范,企业、高校、科研团队充分发挥各自优势,将互补性资源组合,量化转移科技成果,持续创新产业技......
近些年,环境污染事件的发生率逐年提高,迫切需要环境污染事件的快速监测,而传统的环境污染监控手段仍然存在监测技术配套性差和地......
黑客论坛是有效识别黑客工具的数据来源,如何从中挖掘黑客工具的现状及热点是信息安全领域防范网络攻击的重要研究方向之一.基于隐......
随着互联网应用技术的飞速发展,如今社交网络已经成为我们学习生活中一个重要的组成部分,用户通过社交网站,既可以浏览自己感兴趣......
随着社会的不断进步,各领域的科技创新取得了空前的成果,大量专利文献也随着这些新技术产生和积累,专利文本的挖掘工作逐渐成为对......
由于Internet上有可用的大量Web服务,Web服务发现的过程正变得复杂而耗时。Web服务发现是基于目标服务用户描述,并且根据一定的服......
为了解决文本分类任务中未标注数据无法即时标注及成本过高的问题,提出一种面向文本分类的不确定性主动学习方法.提出MSDL(Measure......
网络媒体的迅速发展,使得人们有各种途径去发表自己的意见,也可以迅速获取自己想要的信息。尤其是网络购物方面,很多时候消费者会参考......
随着网络的发展,Web论坛成为Web用户信息共享和分组合作的新平台.Web论坛上积累了海量的知识,由此成为互联网上进行数据挖掘的宝贵资......
FastText文本分类模型具有快速高效的优势,但直接将其用于中文短文本分类则存在精确率不高的问题.为此提出一种融合词频-逆文本频......
为了解决文本分类任务中未标注数据无法即时标注及成本过高的问题,提出一种面向文本分类的不确定性主动学习方法。提出MSDL(Measur......
提出了一个基于改进主题模型的微博话题检测算法。由于传统的主题模型主要适用于传统媒体文字,对短文本的处理效果不是很好。针对......
文本表示是自然语言处理中的基础任务,通常的文本表示模型都是基于训练数据充分的情况下进行。而在训练数据缺乏时,无法完成自然语......
提出了一种基于隐含狄利克雷分布(LDA)与距离度量学习(DML)的文本分类方法,该方法利用LDA为文本建立主题模型,借助Gibbs抽样算法计算模型......
词汇语义关联度计算是信息检索和自然语言处理的关键问题之一。针对该问题提出一种改进的基于Wikipedia语义关联度计算方法 WGR。......
大数据时代的到来使得文本数据的数据量暴增,因此准确而高效地识别和分析文本数据的潜在结构变得越来越重要。要从海量的数据中挖......
微博文本短小、特征稀疏、与用户查询之间存在语义鸿沟的特点会降低语义检索效率。针对该问题,结合文本特征和知识库语义,构建基于潜......
联邦搜索是从大规模深层网上获取信息的一种重要技术。给定一个用户查询,联邦搜索系统需要解决的一个主要问题是数据源选择问题,即......
随着微博平台的快速发展,垃圾信息检测与过滤也面临着巨大的考验,实时精确地识别垃圾信息对于提高用户的体验以及微博平台的可持续......
针对在线网络信息内容安全事件的分类问题,利用网络用户通信信息中含有的时间、关系和内容特征均可基于文本描述的特点,引入LDA模......
针对计量检定装置人工运维效率低、易出错的问题,该文提出了一种计量检定装置智能运维知识库的构建方法。以线下运维日志的历史数......
如何在专利数据海洋中挖掘技术主题的研究现状、识别具有潜力的研发热点,对企业和国家来说都是至关重要的战略议题。针对目前技术......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
近年来自动摘要方面的研究大多是关于多文档和Web网页的,而对网站自动摘要的研究较少。为此,基于主题模型隐含狄利克雷分布(LDA)和网......
通过优化Spark MLlib机器学习库中的隐含狄利克雷分布(LDA)主题模型,提出一种改进的学术研究热点挖掘方法。采用LDA主题模型对学术......
进入二十一世纪以来,人类社会的科技发展进入了前所未有的高速时期。快速更新换代的技术带动了相应专利文献的产生与积累,这种大背......
针对数字资源标签数量不足,获取困难的问题,提出了一种新的自动标签方法,对于收集的公共文化资源数据集和其它公开数据集,能够有效......
针对短文本内容简短、特征稀疏等特点,提出一种新的融合词语类别特征和语义的短文本分类方法。该方法采用改进的特征选择方法从短......
准确识别在线新闻的热点话题,有助于政府了解社会动向、企业洞察消费需求、学者追踪研究热点。为此,提出一种基于隐含狄利克雷分布......
近年来,科技水平飞速增长,科技论文发表量迅速增长,科技论文作为科技资源的重要构成部分,决定着科学研究的进展,如何利用好科技论......
针对构建大规模机器学习系统在可扩展性、算法收敛性能、运行效率等方面面临的问题,分析了大规模样本、模型和网络通信给机器学习......
针对传统K-means算法初始聚类中心选择的随机性可能导致迭代次数增加、陷入局部最优和聚类结果不稳定现象的缺陷,提出一种基于隐含......
针对中文短文本篇幅较短、特征稀疏性等特征,提出了一种基于隐含狄利克雷分布模型的特征扩展的短文本分类方法。在短文本原始特征......
针对慕课教学过程中存在的学生能力差异、缺乏针对性等问题,提出一种基于局部社区发现的主题交互模型,对学生能力评估过程进行主题......
当前对中医学的怀疑关键在于其缺少科学数据的支撑,因此,把中医诊疗的过程数据化十分重要。针对该问题提出一种数据驱动的中医诊疗......
词义归纳是在给定包含多义词语料的条件下,识别出多义词词义的过程,通常是采用聚类的方法.本文提出了基于主题模型的方法来解决中文词......
在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档......
互联网的爆炸式发展,产生了大量易于收集的隐式反馈数据,比如点击、浏览和收藏。如何利用这些隐式反馈数据来推测用户的潜在偏好变......
主题模型利用快速的机器学习算法从高维稀疏的单词数据中提取出低维的主题表示,实现了对文档单词的聚类。对主题模型中的参数进行......
现有的主题情感联合(JST)模型能够同时识别文本中的主题和情感,但是现有的JST模型主要是对文本内容建模,没有考虑用户特征,导致情感......
LDA(latent Dirichlet allocation,隐含狄利克雷分布)主题模型被广泛应用于大规模文档处理,通常用于主题提取、情感分析和文本降维等。......
隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)是在文本挖掘领域一种常用的主题模型。LDA及其变体已广泛应用于发现文本文档......