适于社区挖掘分析与可视化的布局算法

来源 :第29届中国数据库学术会议 | 被引量 : 0次 | 上传用户:liyibo6941
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  社区挖掘算法能够在复杂社会网络中发现社区,却无法精确区分社区边界点,也没有考虑挖掘结果可视化。力导引布局算法是社会网络信息可视化领域的主流布局算法,但是无法反映网络中社区的聚簇特性。因此,提出了社区挖掘分析布局(community detection analysis layout,CDAL)算法来解决这一问题。该算法通过引入度中心度和结构紧凑度对力导引算法进行改进,并采用分层布局的方式实现社会网络的可视化。通过对3个经典社区网络的实验,验证了算法在社区挖掘分析与显示方面的优越性。
其他文献
文章利用隐马尔可夫模型从网络实名的采集、登记、对象、验证、纠错、法律以及身份冒用检测等方面阐述了一个可行、有效的网络实名体系的构建方式。
设计并实现了一个实时复杂事件处理(CEP)引擎。引擎能够快速检测复杂事件,并通过估算最坏响应时间确保引擎的实时性。基于实时CEP引擎,实现了针对独居老人的智能家居监控系统。系统使用无线传感器网络监控老人行为及环境状态,使用实时CEP引擎实时检测复杂事件并发出通知。系统具有灵活性与实时性,能够满足独居老人家居环境中对响应有截止期要求的复杂多变的应用场景的监控要求。
随着各类无线移动设备(如智能手机、平板电脑、GPS导航仪等)的广泛普及,各种基于位置变化信息而提供相关服务的工具日渐受到研究者的关注.借助这类工具,用户可以对路况等一系列信息做出更加准确和有价值的判断和决策.为更好地满足用户的位置跟踪预测需求,借助于Java及Eclipse开发平台,设计实现了一种基于频繁模式的不确定性轨迹预测系统PathExplorer.考虑到移动对象历史轨迹存在的诸多不确定性,
图聚类作为一种重要的图数据挖掘技术,在许多实际应用中已得到广泛的关注。针对图数据日益普及、规模不断增大的现实,提出了一种高效的分布式并行图聚类算法,即MR-LSH算法。该算法是在MapReduce框架的基础上,通过对传统的位置敏感哈希(locality sensitive hashing,LSH)算法的并行化改造,使其可在分布式的集群环境中实现对大规模图数据的高效聚类。通过在真实数据集上的实验,表
近年来,社交网络的高速发展,社交成员的重要性度量受到了越来越多的关注。其中,介数中心度(betweenness centrality)被广泛地应用于节点重要性的度量中。针对图结构频繁变化的场合中介数中心度效率较低这一问题,通过在第1次计算介数中心度时改进Brandes算法,并在之后的更新操作时缩小需要计算的最短路径点对范围,提高寻找最短路径效率的方法,大大提高了有向无权图中加边操作时的介数中心度更
借助于群体移动规律挖掘技术,可以为商业及社会领域提供有效的决策支持,产生巨大的商业价值并具有非常重要的社会意义。但是由于移动通讯领域的发展和移动数据本身的特点,传统技术已经很难满足对海量数据的处理需求。本文设计了一种基于云计算平台的群体移动规律挖掘系统,借助于云计算平台的稳定高效且易于扩展等特性,根据实际应用需要构建可配置的移动轨迹,并通过个体惯常轨迹挖掘和协同聚类来实现群体移动规律挖掘。最后通过
如何处理缺失值一直是数据库领域中一个值得关注的问题,缺失值问题的研究对于提高运算效率和保证系统健壮性具有重要意义。云环境中海量数据的稀疏性使缺失值问题变的更加突出,现有的处理方法要么语义表达能力有限,要么未考虑到云环境对其的影响。针对这些问题,提出了一种面向海量稀疏数据存储的缺失值处理方法:首先结合现实的云环境应用,把缺失值归纳为未知值和不存在值两类;其次基于该语义定义了算术运算及比较运算;然后利
随着语义网技术的发展,RDF数据应用的领域越来越广泛,因此产生了海量的RDF数据,对存储和查询提出了更高的要求。在RDF数据上建立多索引结构能有效地提高查询效率,设计了一个包括一个词典表和3个不同顺序的数据表的RDF数据存储模式,通过对数据表的排序和建立次要索引实现了多索引功能,并设计了能够使SQL优化执行的SPARQL转化策略和算法,有效地提高了查询效率。
由多核CPU和GPU构成的异构计算平台已经成为当前高性能计算的重要发展方向,为充分发掘异构计算平台的潜力,有效提升列数据库查询的性能,首先提出了一套列数据库查询的原语集合,并根据多核CPU和GPU体系结构的特点,优化原语实现机制,充分开发了原语内的并行性.同时,将SQL查询语句编译为原语构成的依赖图,并提出了一套调度机制,使得多个原语可以在多核CPU、GPU以及磁盘等部件之间并行执行.通过对TPC
高效且准确地找出存在于深网中的与用户查询意图最相关的Top-N元组,是深网数据集成中的关键问题。针对数据源内容概括未见成果的现状,本文提出了一种能够有效概括非数字、非离散属性特征的非合作结构化深网数据源摘要构建方法。利用主题词抽样,依据主题语义选择与主题词相关的特征词,通过主题词及特征词构建数据源语义摘要。实验结果表明与传统的基于词频的方法相比较,该方法在召回率及准确度方面均有较大幅度的提升。