【摘 要】
:
随着网络技术和移动终端设备的发展,各种各样的在线社交网络平台已经成为人们生活中的一部分。与传统社交网络不同,在线社交网络中较低的交友成本和快速传播信息的特性使其可以在短时间内快速扩张。社区结构是在线社交网络的重要特性之一。根据由不同兴趣、职业、地域形成的社区结构可以开展各种商业行为。现有的动态社区发现方法通过分析多个时刻的用户交互网络来生成与每个时刻对应的多个社区结果。然而,在线社交网络中充满了大
论文部分内容阅读
随着网络技术和移动终端设备的发展,各种各样的在线社交网络平台已经成为人们生活中的一部分。与传统社交网络不同,在线社交网络中较低的交友成本和快速传播信息的特性使其可以在短时间内快速扩张。社区结构是在线社交网络的重要特性之一。根据由不同兴趣、职业、地域形成的社区结构可以开展各种商业行为。现有的动态社区发现方法通过分析多个时刻的用户交互网络来生成与每个时刻对应的多个社区结果。然而,在线社交网络中充满了大量的噪声交互,会导致社区发现算法高估用户间的亲密度,进而生成错误的社区结果。为此,本研究针对用户交互行为设计了一种在线社交网络交互数据分析方法,并在此基础上提出了一种基于互惠度的交互数据采样方法。该采样方法将原始交互数据作为输入,通过分析用户之间的互惠行为剔除数据中的噪声交互,并将采样后的数据提供给社区发现算法。社区发现算法使用采样后的交互数据生成的社区结果有更高的准确性,并且由于采样降低了交互数据量,社区发现算法的时间开销也大幅减少。本研究对在线社交网络中用户的交互互惠行为进行了研究,深入分析了交互互惠度和用户社交地位之间的联系。针对在线社交网络庞大交互数据量和大量噪声交互影响社区发现效率及准确性的问题,本论文提出在社区发现之前对交互数据先进行预采样的解决方案,剔除噪声交互并降低数据量。首先,考虑到社交地位会影响用户的交互行为,本论文基于用户社交地位划分出了多个用户群,每个用户群将单独进行交互分析及数据采样。其次,由于交互互惠度可以反映交互的重要程度,本论文提出基于用户对在多个时段的互惠度为每个用户群建立互惠模型。最后,本论文基于每个用户群的互惠模型挖掘群内用户对在不同时段的交互重要性,并根据重要性进行交互数据采样,剔除重要性低的交互。实验表明采样后的数据中交互的重要性普遍更高,并且使用采样后数据的动态社区发现算法有更小的时间开销和更高的准确性。本文的主要研究成果有:(1)考虑到在线社交网络中大量的噪声交互会对社区发现算法产生影响,本论文提出在社区发现之前对交互数据先进行预采样来剔除噪声交互的解决方案。预采样的思想降低了采样方法和社区发现算法的耦合性,使采样后的数据可以作为任何现有静态、动态社区发现算法或其他有关在线社交网络的研究工作的输入。(2)为了深入分析用户随时间变化的交互行为,本论文提出了一种在线社交网络交互数据分析方法。考虑到用户的社交地位通常会影响其交互行为,本论文于社交地位划分了多个用户群,然后结合用户群划分研究了用户对在不同时段内的交互互惠度。(3)为了剔除在线社交网络中的噪声交互,在针对不同用户群的交互互惠度分析的基础上,本论文提出了一种基于互惠度的交互数据采样方法。其中基于互惠度数据和耦合隐马尔可夫模型建立每个用户群的互惠模型,并通过互惠模型估计用户对在每个时段内交互的重要性,然后剔除重要性较低的交互。每个用户群单独的互惠模型避免了不同社交地位用户的不同互惠度范围和互惠度变化规律对重要性估计产生的影响。(4)本论文使用了三个在线社交网络数据集和三个动态社区发现算法,从评估采样后数据和评估使用采样后数据生成的社区质量来说明采样方法的有效性。实验结果表明,采样后数据中的用户对有更高的互惠度、社交地位相似度,这表明交互的重要性普遍更高。并且使用采样后数据进行动态社区发现的时间开销更少,社区结果的准确性更高。
其他文献
“据……说/看”是现代汉语中常用的介词格式。以往研究将其纳入框式介词、介词框架、介词格式、介词框架结构、插入语等范围。从历时与共时相结合角度出发,考察“据……说/看”的产生、发展与演变及其句法特征和语义特征。从历时与共时相结合角度入手,梳理“据……说/看”类格式的产生与发展,以此明晰格式后项“说”类词、“看”类词的词性与意义。“据……说/看”类格式表示信息来源在六朝已有用例。历时发展中后项“说”类
随着我国研究生教育规模的扩张,研究生导师的增长幅度跟不上研究生的扩招幅度。导师指导的规模扩大、硕士生择导的理性缺失、当前导生双选制度与硕士生换导制度欠缺等问题严重影响了导生关系的和谐发展。硕士生换导意愿与换导行为是导生关系破裂的直接表现。因此,探究换导硕士生与导师的关系问题对减少导生间的错位匹配,构建和谐导生关系具有重要的理论意义与现实意义。研究首先基于2021年中国硕士生学习与发展调查数据,通过
随着“饭圈”文化的发展,饭圈粉丝集体行动逐渐规模化,“粉丝行动主义”逐步兴起,并基于其亚文化属性对主流文化发起挑战,影响着整个国家的文艺生态环境,对我国的文化建设、经济秩序和社会发展战略都造成了一定的影响。文艺的作用从来都不是单一的作用,文艺在我国社会主义建设道路上扮演着重要角色,它关系着一个时代的精神、价值、认同,关系着一个国家的综合实力和文明进程。因此,政府及时采取措施,对“饭圈”乱象展开了治
随着“第四媒体”互联网的兴起与发展,网络己成为人们获取信息的主要来源和表达观点的重要阵地,数量庞大的网民在网络平台表达观点和发泄情绪,生活中的敏感事件在网络上更容易造成群体效应,大量网民不断围观解读,使得事件进一步得到放大,网络舆情随之产生。作为我国网民群体的重要组成部分,高校师生不但熟悉网络,而且参与意识强烈、善于表达观点,围绕某一事件的关注和讨论往往使得他们成为高校舆情信息的主要发布者和传播者
分区命名空间固态盘(Zoned Namespace Solid State Drive,ZNS SSD)以zone为单位管理闪存资源,将数据布局及垃圾回收操作交由主机负责,可以为基于日志结构合并树(Log-Structured Merge Tree,LSM-tree)的键值存储系统提供可预测的性能和稳定的带宽。键值存储系统的合并排序与垃圾回收存在双重写放大,而较大的zone也使得垃圾回收时数据迁移
工业控制系统作为现代工业基础设施的重要支撑系统,其安全与国家安危紧密相连。云计算的引入为工业控制系统带来转型升级的同时,也增加了其面临的信息安全风险。愈来愈开放的系统架构使现场设备、物理设施等直接暴露于网络攻击下,亟需构建适用于工业控制系统现场层的信息安全防护体系以应对智能复杂的网络攻击。本文针对云环境下工业控制系统现场层信息安全防护问题,分析系统的体系架构、运行特点及安全防护需求,利用边缘节点的
近年来,随着物联网的快速发展,物联网设备的数量呈爆炸性增长,越来越多的应用程序对延迟具有严格的要求。移动边缘计算(Mobile Edge Computing,MEC)技术可以帮助移动设备将计算密集型任务卸载到附近的边缘服务器,加快计算过程的同时缓解了物联网设备的资源短缺困境。另一方面,在异构网(Heterogeneous Network,HetNet)和超密网(Ultra Dense Networ
随着大数据、人工智能、云计算以及物联网等技术的不断发展与完善,全球数据呈爆发式增长,数据安全显得愈发重要。传统的多副本和纠删码等被动容错技术会造成存储空间、网络带宽和计算资源的浪费。为了降低这部分开销,相关研究人员开始研究以硬盘故障预测为主的主动容错技术。现有故障预测方法仍然存在预测误差,且每次故障预测都是一个相对独立的过程,导致其预测结果可解释性较差,对硬盘处理决策的指导意义有限,实际应用价值低
安全多方计算(Secure Multi-party Computation,MPC)能够为隐私数据的分布式合作计算提供有效解决方案,是密码学领域中的热点研究问题之一。保护隐私的集合计算(Private Set Operation,PSO)作为安全多方计算领域的特定应用问题,允许多个参与者利用各自的隐私集合数据,协作完成特定计算,同时保证计算过程中不泄露任何人的隐私数据。PSO主要包括隐私集合交集计
白先勇成长于传统文化的濡染之中,同时又深受“西方影响”,多元的文化场域使他对中国文化的命运有着独特的思考,这些思考体现在他的小说创作中,所以他的文本创作有很大的阐释空间。以“文化磨合”论为指导,可以通过考察白先勇的文化认同进而审视其文化策略,并以文学文本为具体个案考察其文化策略的实践。不管是宏观文化层面,还是微观文学层面,都彰显着白先勇在多元文化质素的磨合中,对中国文化复兴和文化创造的深刻考量。在