大规模数据下的社交网络多标签分类研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:zyzy828
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,社交网络也深入到每个人的生活中,近年来,社会网络越来越受到关注,出现了很多如QQ、微博、Facebook等拥有大量用户的社交网站。无论是改善现有的系统和设计新的社会网络应用方面,这些社交网络的属性研究吸引越来越多的研究者关注。多标签分类是社交网络中的一项重要应用,随着标签分类的日益普及,网络数据的多标签分类成为数据挖掘领域的一个研究热点。本文的主要工作如下:(1)基于真实数据下的社交网络用户的多标签分析。社交网络中用户的每条信息都可以作为他们的标签,经过分析国内使用率比较高的几款社交网络,以QQ社交网络这个拥有大量用户、使用范围最广泛的数据作为研究对象,基于其社会背景属性,系统地分析并归纳了在这个社交网络中用户的标签信息分布情况,以现有的数据来评估整个QQ真实网络的结构,使我们对于一个社交网络有了详细的了解。(2)针对多标签分类算法应用于大规模社交网络中时,网状数据带来的时间复杂度偏高的问题,提出了一种启发式的大规模社交网络下的多标签分类算法,依据社交网络的结构属性,通过引入由目标节点、源节点以及他们之间最短路径组成的多目标核心网络,在相对短的时间得到分类的最大精度。对实际网络进行实验分析,与现有的多标签分类方法相比,实验结果证明我们提出的方法可以帮助预测在网络环境中更精确、更有效的标签。(3)结合本文提出的多标签分类算法和经典的多标签分类算法,我们设计了一款社交网络多标签分类工具软件,目的是为了方便、直观计算社交网络下的多标签分类算法,同时也能方便的进行多标签分类的对比实验。
其他文献
近年来,随着车辆保有量的持续上升和智能交通的建设,自动驾驶系统已成为车辆行业热门的研究方向。全球很多学校和研究机构都在致力研究自动驾驶功能,减少驾驶过程的驾驶失误,提高驾驶安全性。车道保持功能作为自动驾驶主要功能之一,已经受到很多研究机构关注,因此研究车道保持功能有着十分重要的实际价值。论文的主要研究内容如下:通过一种基于自适应阈值的方法实现了道路信息的识别。该方法通过逆透视标定实验消除摄像头的透
高光谱图像在光谱分辨率、信息量、信息采集能力等方面都优于传统的图像,然而,过多的冗余和过大的数据量会导致图像处理效率大大降低。图像压缩是一种重要的解决方式。通过压
随着信息技术的快速发展,虚拟现实技术在人们生活中的影响越来越大。基于虚拟现实的手术训练仿真系统为手术训练和训练效果评估提供了强有力的工具。保证虚拟手术仿真结果真
随着娱乐业、旅游业等第三产业的快速发展,不法分子不再局限于伪造、倒卖车票、船票、邮票等传统的有价票证来牟利,而是越来越多转向伪造、倒卖假门票、假贵宾券、假充值卡等
单质硫固有的电子/离子绝缘性,循环过程中巨大的体积膨胀,以及由可溶性多硫化锂中间体(Li_2S_n,4≤n≤8)引起的“穿梭效应”等问题阻碍了锂硫电池的商业化发展。聚吡咯材料具有较高的电子/离子导电性、良好的化学稳定性等优点,并且能有效抑制多硫化物在放电/充电过程的扩散,因此,在锂硫电池领域中有较大发展潜力。为改善硫-聚吡咯复合正极的电化学性能,本文使用硬模板法制备三维介孔聚吡咯材料,另使用双模板
推荐系统作为一种信息过滤技术,能快速的定位到用户感兴趣的物品,解决信息过载和用户喜好之间的矛盾。随着信息量的增加,传统的实体行业也开始将推荐系统纳入自己的特有领域
作为人们赖以生存的基础产业,农业在许多方面影响着人们的基本生活。农业生产既面临自然灾害,而且也受到外来市场的冲击,这就使得农业保险在保障方面有重大意义。近几年来,受
随着移动通信技术的飞速发展,用户的需求越来越多样化,通信的调制方式也日益多样和复杂,为了正确的解调不同通信系统的通信信号,就需要识别出接收信号的调制方式及其信号参数
冬季积雪结冰现象依然困扰我国陆路交通的安全,针对这一问题的解决方案之一即是融雪剂沥青混合料,而我国交通运输行业历经数十年发展,目前已迈入建养并重的新时代,大面积铺设功能性路面的应用可能性逐渐降低,磨耗层作为一种常规养护方式具有较广泛的应用前景,故本文针对含缓释蓄盐材料的沥青磨耗层进行系统性研究。本研究依托西安市公路工程管理处科研项目,系统性对蓄盐磨耗层进行相关研究。本文首先在研究沥青与盐化物填料之
随着网络技术不断地发展,网络带宽的成本愈发下降而且网络接入设备种类与方式的不断增加,使得以配备多个网络接口为特征的多宿主终端越来越普及。但是,多宿主终端的特征也带