社交网络博客主题挖掘与应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wjyai333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0兴起让越来越多的网络使用者参与到社交网络中,他们热衷于进行资源分享,信息互换,互相之间的交流也越来越多。针对用户产生内容的研究不仅可以帮助商家了解各类不同用户群对商品的喜好趋势,也能改善多种网络服务,对用户体验具有很重要的意义。Blog是社交网络中最主要的用户产生内容,如何准确了解博文的分类是用户兴趣与关注点分析的基础。本文针对blog(博客,又称为博文,网络日志)进行了两方面的研究:针对博文的主题分类研究以及基于博文内容的潜在好友推荐的研究。具体工作如下:1)针对现有的文本分类方法不能很好应用于博文等多主题文档的现状,提出了一个双层的多标签博客主题分类模型。通过使用文本预处理等步骤,模型提取出关键词并结合使用《知网》与《同义词词林》这两个知识库进行语义相似度匹配,并利用Dempster证据理论为博文进行多标签自动分类。文章使用语料库和人人网数据进行实验分析,结果证明了该模型的有效性与可延展性,很好的解决了具有多主题特点的社交网络博文分类的问题,为社交网络用户群体分析提供基础。同时,模型解决了普遍的规则文档的分类问题,为网络信息分析和解读提供了有效工具。2)由于网络用户渐渐已经不满足于现实中的朋友圈形成的社交圈,在社交网络中找到拥有共同兴趣爱好的陌生用户成了众多用户的需求。为此,本文关注了博客多标签主题分类的应用:针对用户的博文内容进行的潜在好友推荐。模型通过对用户博文进行分析,挖掘到用户的兴趣关注分布,再基于用户兴趣随时间变化的问题,引入时间敏感因子,提出了粗化和细化两部分的推荐模型,这不同于现有的基于好友间关联程度的好友推荐系统。本文通过采集人人网实际数据对提出的模型进行了测试,大部分的潜在好友推荐获得了验证,细化部分的推荐顺序也在人工比对中得到认可。
其他文献
以 OFDM 为主要调制技术的 IEEE 802.16 无线城域网具有高宽带,高数据传输速率和较强的系统灵活性等特点,对系统的实时性要求较高。 数字中频处理是 WiMax 系统的重要组成部
针对手机定位的检测概率和定位精度等难题,本论文介绍了一种基于手持中继的多步 CDMA 移动终端跟踪定位方法。该方法基于多个手持中继形成的虚拟接收阵列,并采用多步方法以提高
本论文在对网络考试系统涉及的关键技术和理论进行深入研究的基础上,详细阐述了一个智能化考试系统的设计与实现。本系统的体系结构采用三层B/S/S结构,数据库采用oracle,在中间
便携式数字存储示波表(DSO:Digital Storage Oscilloscope)是传统电子测量仪器模拟示波器功能的延伸和发展,它充分利用了当今集成电路所具有的高集成度、超低功耗等优点,而且
学位
微电子与射频技术的发展使得射频识别(Radio Frequency Identification,简称RFID)技术走向成熟,RFID便于跟踪识别管理的特点使其在社会经济的各个领域发挥了独特的作用,成为国内