移动环境中的交往社区分析研究与系统实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:tytytytytytytytytyty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着移动通讯技术和海量数据的采集存储技术飞速发展,移动运营商积累的数据空前增长。这些数据中包含着关于用户行为习惯的信息,其中用户间使用通话,短信等方式进行的联系构成了移动用户的社交网络。挖掘社交网络包含的信息可以帮助运营商制定营销策略,提升服务质量。   针对移动用户话单,短信等海量数据的特点,本文提出了用于分析移动用户社交网络结构的HPB算法和用于社区发现的CCMC算法,并实现了应用HPB和CCMC的社区发现系统。主要工作包括:   (1)提出了适用于海量移动数据的网络半径估计算法HPB(Hop Plot byBit-mask)。相比同类算法,HPB的准确率较高,受图的拓扑结构和数据量的影响很小,需要较少的时间和空间开销。   (2)提出了适用于海量移动数据的社区发现算法CCMC(Concentric-CircleModel of Community detection)。CCMC将一个社区描述成一组同心圆,中心的圆由社区中最有代表性的用户组成。比起传统的社区发现算法CCMC的优势在于能处理带权图,能处理社区彼此重合的情况且方便控制发现社区的粒度。   (3)在北京大学数据库实验室研制的数据挖掘系统MobileMiner基础上,利用HPB和CCMC算法实现了用户社区分析子系统。   实验证明,本文提出的算法能够有效处理移动用户产生的海量数据。用户社区分析子系统可以方便地用于移动用户行为分析且具有较好的扩展性。
其他文献
某供电局电力信息一体化平台整体结构复杂、信息量大,综合了设备台帐、电力生产、电力设备采购、电力管理办公、变电运行日志、无功管理、停电计划管理、电力培训等多个系统,但
随着语义网的发展,本体越来越多地在各个领域被应用。然而由于本体的创建对领域知识的理解不同,侧重的角度不同,使用的建模方法不同,即使是在同一领域的共享概念上创建的本体,不同
当前,信息系统已经从纯粹的信息展示窗口演变成包含实际应用逻辑的业务平台。这要求信息系统不仅能够支持数据的展现、存储、检索和管理,还应该支持对业务流程的管理。然而,在大
在预测模型中,当自变量的维度增加时,预测精度和算法性能都会显著下降,这就是所谓“维度诅咒”的问题。针对这一问题的多数解决方法都依赖所谓稀疏性假设,即函数值只依赖高维变量
自提出至今,面向侧面编程(Aspect-Oriented Programming,AOP)技术已被证明可以有效地改善软件的可维护性、可理解性以及可演化性。为了使用AOP技术重构遗产软件,首先需要自动或
无线传感器网络是由大规模传感器节点利用无线信道组成的多跳自组织网络,其中,传感器节点在其微小的体积内集成了数据采集、数据处理和无线通信等多种功能。传感器网络引发了信
Web已经成为一个庞大而复杂的信息仓库。如何利用程序从海量的Web中快速抽取信息从而提高人们获取信息的效率变得越来越重要。Web中一类重要的信息网页是数据提供网站的动态W
基于图像的绘制技术(IBR)作为计算机图形学、计算机视觉和图像处理多领域交叉的热点研究,近十年来取得了显著进展。其中,基于图像的视觉凸壳(IBVH)方法将建模的思想引入绘制,使
日前,传感器网络(Sensor Networks)技术已经被广泛应用于很多领域如空气质量监测、水体污染监测等。在这样的监测应用中,相比于原始感知数据,用户对所监测区域内数据的实时分布
在大多数无线传感器网络应用中,受频段和成本的限制,传感器节点往往共享同一信道,这种共享信道的无线传感器网络经常遭受由并发链路带来的干扰。并发链路的干扰严重降低了网