基于链接的Blog社区发现技术研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:pie1011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Blog是一种基于RSS技术的信息交互平台,它是一种作者与读者以日志风格进行交互的中介,是一种崭新的信息传播和交互方式。与传统的网络信息相比,Blog领域链接关系更加丰富,Blog作者间交互更加频繁,为用户在互联网上发布信息和进行交互提供了方便。  随着Blog的迅速发展,信息量的膨胀和信息源的无限增加也给互联网用户查找自己所关心的信息带来了不便。另一方面,Blog作者通过阅读或评论等行为与其他Blog撰写者进行交流,从而形成很多潜在的社区,如何发现这些社区并分析社区成员之间的关系已成为一个亟待解决的社会学问题。  本文对基于Blog链接的社区发现方法进行了研究,目标是发现潜在的社区和分析社区内的主题社区结构,为信息检索和社会性网络分析提供方便。由于对Blog之间的关系是从社会学角度分析,因此发现的潜在的社区包含多个主题社区,每一个主题社区内成员间讨论相似的主题。  本文在对Blog特点进行深入的研究之后,发现Blog链接具有丰富的语义,Blog作者之间通过这些链接形成很多潜在的社区,本文称这种潜在的社区为双向意识社区。为了发现和分析双向意识社区,本文先提出了一个基于链接的Blog关系计算模型,该模型从社会学角度定义Blog间的关系,并计算Blog关系强度。然后采用一个基于Blog排序的聚类算法,该算法通过迭代的计算Blog与种子Blog之间的关联系数,能够发现以种子Blog为中心的双向意识社区。  Blog作者兴趣爱好的多样性,使得双向意识社区内形成多个不同的主题社区,其中每一个主题社区内讨论相似的主题。因此,本文在发现双向意识社区的基础上,提出了一个计算Blog间的主题相似性的模型,并基于该模型,提出了一个抽取双向意识社区的主题社区的算法。通过考虑Blog社区的层次结构,该算法在对主题社区进行识别的同时,也实现了对社区的分层,形成社区的层次结果。  基于以上的研究成果,本文设计并实现了一个Blog社区发现的实验原型系统,包括了数据解析、关系计算、社区发现等模块,为进行相关的算法实验和研究提供了一个基础平台。
其他文献
本文探讨了软件体系结构的基本内容和目前流行的两种体系结构,并对WEB应用框架技术进行了详细的描述。本文的主要研究工作是设计并实现了一个新的基于WEB技术的业务系统生成
随着Internet的普及和快速发展,Web已经成为富含多种信息资源、遍布全球的共享信息仓库,成为人们获取信息的有效手段和重要方式。Web信息门类齐全、数据量庞大,几乎无所不包,然而
本文研究了从视频序列图像中提取人脸肖像的方法。采用由粗到精的多级搜索策略,首先对运动目标进行人形判断并获取彩色头肩像,实现人脸粗定位; 然后结合肤色模型和模板匹配实
随着信息技术的普及,互联网逐渐成为人类物质社会的重要组成部分,应用领域已转向大型、关键业务系统,人们对网络的依赖越来越严重。但  是频繁发生的网络安全事件,对信息技术的
RSS(Really Simple Syndication,真正简单聚合)技术可以将互联网上的信息以订阅的方式聚合到一个窗口中。随着Blog的发展和流行,基于RSS技术的Blog或播客被引入到辅助学习的工
随着网络的发展,人们获取知识的手段已逐渐从学校,书本,报纸,电视,广播转向了网络,人们通过远程教育实现异地学习,通过在线考试检验学习效果,运用网络课件进行辅助学习,可以说这些手段
感知网(无线传感器网络)是将多个带有无线通讯模块的感知节点(感知节点)部署在需要的区域内,这些感知节点自组织成一个网络,利用自身的传感器采集数据,使用自身的通讯模块通
传统电信网上的多媒体会议应用,一方面由于其实现机制复杂、造价高昂,难以推广。另一方面,传统电信网的封闭架构和低带宽也很难实现多媒体业务的快速开发与部署,并满足大量多媒体
物联网被认为是继计算机、Internet之后推动世界科学技术发展的第三次推动力。物联网将所有人与物的互联,将真实物理世界和虚拟信息世界链接融合,以实现人类对物理世界的实时感
近年来,面向服务体系架构(SOA)迅速成为企业级软件的核心体系架构,并得到迅速推广和普及,成为电子商务和电子政务应用的主流技术选择。一个客观事实是,电子商务和电子政务的企业