基于LDA模型的网页采集算法设计研究

来源 :大庆师范学院学报 | 被引量 : 0次 | 上传用户:ajie830510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据网页动态内容提出了一种具体采集方法,利用基于关联的LDA(Latent Dirichlet Allocation)算法,设计了一个基于内容的网页动态内容采集算法.本算法能为网页中的动态内容提供自动注释,并且利用了动态内容和文本内容之间的语义关系.基于关联的LDA提供了概念级匹配,来建立文本和网页动态内容之间的对应关系,以达到更高检索精确度.实验结果表明,与基于SVM方法相比,本算法具有较高的精确度和召回率.
其他文献
摘 要:本文分析了我国大学体育教育改革存在的问题,论述了我国大学体育教育改革的基本方向。并且,阐述了新课程标准下我国大学体育教育改革方向,以及对新时期体育生活方式下要求的大学体育教育改革方向作出了展望。  关键词:大学体育教育 改革 方向  中图分类号:G807文献标识码:A文章编号:1674-098X(2012)07(b)-0182-01  近年来,大学体育教育改革取得了重大突破,以学生为中
二重积分计算在数学、物理、化学等各学科中占有重要位置,研究其计算方法,可以给各学科相关应用带来方便。常规计算二重积分要将其化成累次积分再进行计算,这种方法对一类积
随着多点燃油喷射发动机的普及,电喷发动机燃油系统和进气系统的积碳现象日益增多,一些由于积碳而引起的特有故障现象也随之而来。在汽车维修中对于积碳的诊断一向是个难题,
目前在川瀹地基桥梁扩大基础的设计施工中常常会遇到红层软岩互层地基这一特殊情况.本文对川渝地区红层软岩水平互层对桥梁扩大基础承载力影响进行有限元分析,得出了相关结论,可
充分利用现代分析仪器、先进多媒体教学设备和实验室信息化网络,调整和改革传统的食品检验类理论课和实验课分轨授课的教学模式,采用"学检互动"绿色食品检测人才培养模式,使学