【摘 要】
:
大数据时代的到来使得文本数据的数据量暴增,因此准确而高效地识别和分析文本数据的潜在结构变得越来越重要。要从海量的数据中挖掘模式和知识,需要借助于强大的计算工具,所
【机 构】
:
贵州省公共大数据重点实验室,贵州大学计算机科学与技术学院
【基金项目】
:
国家自然科学基金项目(编号:61540050,61462011), 贵州省重大应用基础研究项目(编号:黔科合JZ字[2014]2001), 贵州省科技厅联合基金(编号:黔科合LH字[2014]7636号), 贵州大学研究生创新基金项目(编号:研理工2016051)资助.
论文部分内容阅读
大数据时代的到来使得文本数据的数据量暴增,因此准确而高效地识别和分析文本数据的潜在结构变得越来越重要。要从海量的数据中挖掘模式和知识,需要借助于强大的计算工具,所以机器学习科学家提出了概率主题模型。当前,以隐含狄利克雷分布(LDA)模型为代表的经典概率主题模型已经被广泛地应用到数据挖掘的各个方面。由于LDA模型对区分相似主题的能力非常差,影响了LDA的实际应用性能,为解决这一重要问题,论文基于LDA模型提出了一种名为NRLDA的新模型。考虑到相似主题的文本中存在大量的对区分不同主题没有贡献的噪音词语,在N
其他文献
为实现月牙肋岔管的快速设计,应用UG软件中基于模板的参数化建模技术。在进行月牙肋岔管设计时,在参数表中输入基本参数和设计参数,就能得到月牙肋岔管的三维模型和工程图,大
1月,浙江印发《浙江省汽车产业高质量发展行动计划(2019-2022年)》;5月,又印发了《关于促进我省汽车产业整零协同创新发展的实施意见》和《2019年汽车产业高质量发展工作要点
那个曾高悬在头上的无限高远的苍穹,突然变成了低压的拱顶,原先闪烁着免:辉乌金幻的土地逐渐失去了神秘感。然而这片土地给自己与内地造就的黄金岁月,是多少尘埃也掩盖不了的
目的观察奥拉西坦联合多奈哌齐治疗血管性认知障碍(VCI)的临床疗效。方法将82例VCI患者随机分为观察组和对照组各41例。对照组给予多奈哌齐治疗,观察组给予奥拉西坦联合多奈哌
目前,地方高职院校在校生源主要是新生代农家子弟,其成长在社会转型期受各种影响剧烈,家庭教育普遍缺失、社会价值导向多元、农村基层社会监管乏力的现象值得教育教学管理者进行
高职院校高等数学课程的教学内容和教学模式急待改革,本文将建立高职院校高等数学课程主模式的若干问题。高职高等数学课程主模式的理念、结构和推进高职高等数学课程主模式的
目的分析盐酸胺碘酮治疗冠心病室性心律失常的临床效果。方法将54例冠心病室性心律失常患者随机分为研究组和对照组各27例,在常规治疗基础上,研究组予以盐酸胺碘酮治疗,对照