【摘 要】
:
传统的主题爬虫在计算主题相似度时,通常采用基于词频、向量空间模型以及语义相似度的方法,给相似度计算准确率的提升带来一定瓶颈。因此,提出融合LDA的卷积神经网络主题爬虫
【机 构】
:
宁波大学信息科学与工程学院,宁波大学图书馆与信息中心
【基金项目】
:
国家社会科学基金/后期资助项目(No.15FTQ002),省部级实验室/开放基金(No.B2014)
论文部分内容阅读
传统的主题爬虫在计算主题相似度时,通常采用基于词频、向量空间模型以及语义相似度的方法,给相似度计算准确率的提升带来一定瓶颈。因此,提出融合LDA的卷积神经网络主题爬虫,将主题判断模块视为文本分类问题,利用深度神经网络提升主题爬虫的性能。在卷积层之后拼接LDA提取的主题特征,弥补传统卷积神经网络的主题信息缺失。实验结果表明,该方法可以有效提升主题判断模块的平均准确率,在真实爬取环境中相比其他方法更具优势。
其他文献
由高等教育出版社发起,教育部高等学校生物科学与工程教学指导委员会、全国高等学校教学研究中心、中国高等学校教学研究会及有关高校共同举办的首届高校生命科学基础课程报告论坛于2006年11月10日在上海交通大学隆重召开。 出席本届论坛的有:教育部原副部长、中国高等教育学会会长周远清教授,北京大学校长许智宏院士,中国工程院副院长旭日干院士,中国科技大学教授施蕴渝院士,南京工业大学校长欧阳平凯院士,北京师
通过心理调查,发现部分大学生学习英语时,存在明显的认知失调,并有习得性无力感泛化的迹象。这就要求大学英语教学改革必须在实践中生成,必须建立在了解学生心理、分析学生心理和
近年来,伴随着我国经济和科技的发展,中国通信行业也取得了长足的发展。现今,为了满足社会工业和人民生活智能化、智慧化的需求,通信技术的应用也越来越重要和广泛。然而,任
在光通信行业不断发展的今天,光纤光缆制造业却面临着变革的压力,产能相对过剩倒逼工艺技术的创新发展。目前光纤光缆制造技术已非常成熟,各大厂商技术发展的目标不约而同的
针对TLD(Tracking-Learning-Detection)算法在光照变化不均、遮挡严重、跟踪目标模糊等情况下会出现跟踪失败的问题,提出一种基于卷积神经网络优化TLD运动手势跟踪算法。选取手势特征作正样本,其背景作负样本,获取手势HOG特征并投入到卷积神经网络中加以训练,得到手势检测分类器,从而确定目标手势区域,实现手势的自动识别;再利用TLD算法对手势进行跟踪与学习,对正负样本进行估计检
首先阐述了交通安全设施管理的意义,然后对公路中相关交通安全设施的设计进行研究,包括护栏,交通标志设置,标线及反光路钮,隔离设施设置,轮廓标设置,防眩晕设置,防撞桶设置等
信息技术的不断发展促使人们已经进入到5G时代,相比于3G、4G技术,5G技术更具有技术优势,可以为人们提供优质的服务,实现各个领域的突破,尤其是对于广播电视领域来说,加快了媒