【摘 要】
:
随着我国移动设备的不断普及和新一代互联网信息技术的快速进步和发展,对国民的经济生产和日常生活方式产生了许多重大转变。国内外的研究学者在探索如何利用社交网络中某些节点的影响力来实现效益最大化这个问题的过程中,在社会科学研究应用领域上取得了非常丰硕的研究成果。但是随着移动社交信息网络的发展,活跃的社交用户数量呈现出一种指数性的增长速度,网络的用户规模也日益扩大,出现了如信息模式异构、网络动态变化等特征
论文部分内容阅读
随着我国移动设备的不断普及和新一代互联网信息技术的快速进步和发展,对国民的经济生产和日常生活方式产生了许多重大转变。国内外的研究学者在探索如何利用社交网络中某些节点的影响力来实现效益最大化这个问题的过程中,在社会科学研究应用领域上取得了非常丰硕的研究成果。但是随着移动社交信息网络的发展,活跃的社交用户数量呈现出一种指数性的增长速度,网络的用户规模也日益扩大,出现了如信息模式异构、网络动态变化等特征,给进一步的研究工作带来了新的挑战。(1)在线社交网络当中节点之间的联系是动态变化的,而不是固定不变的,想要获取节点的动态影响力,就需要解决网络的时序性问题,本文在Page Rank算法的基础上进行改进,通过引入节点间动态连接概率、平滑时间窗口模型等,建立了基于最末退出时间的Max-Page Rank节点中心性度量算法、基于中间时间的Mean-Page Rank节点中心性度量算法和基于平滑时间窗口的TW-Page Rank节点中心性度量算法,在基础算法上增加了对网络时序关系的刻画。(2)呈指数增长的大规模在线社交网络数据,需要实时地对社交网络节点进行度量计算,传统的节点影响力最大化算法难以应对,且频繁操作会造成计算资源浪费。计算过程对内存、处理器和IO的要求过高,且运行速度很难迅速反馈出结果。本文利用大数据计算平台,将单机算法改为分布式并行计算,提出一种基于Spark分布式框架的节点影响力度量算法,旨在提升计算速度。本文针对当前在线社交网络规模庞大、网络异构、动态变化等特征,首先将所提出的三种改进的Page Rank节点中心性算法与同类型的其他算法进行实验比较,选取了5个真实的动态社交网络数据集作为研究对象,从SIR模型、准确度和时间性能三个维度进行评价分析;结果表明,本文所提的三个算法在SIR模型和准确度方面具有一定优势,其中基于平滑时间窗口的TW-Page Rank节点中心性度量算法准确性表现最佳,在71%-84%之间,在SIR评价指标下更适用于大规模动态社交网络数据的计算,紧随其后表现优异的是另外两种算法:基于最末退出时间的Max-Page Rank节点中心性度量算法和基于中间时间的MeanPage Rank节点中心性度量算法,更适用于小规模的动态社交网络数据。最后运用了大数据平台Spark来实现分布式并行算法,时间性能上相比原来的单机运行提高了近10倍,解决单机处理动态社交网络计算开销和时间效率的挑战。
其他文献
自我国改革开放以来,特别是加入世贸组织之后,随着经济全球化的不断深入,我国经济水平的提升令世界瞩目,特别是东部沿海地区1,经济增速远超我国其他地区,东部沿海地区除了有优越的地理位置、各种天然的港口、完备的基础设施、政府政策支持和人口资源等因素外,本文认为东部沿海企业海外直接投资(OFDI)也是其构成优良的经济基础的重要因素之一。党的十八大以来,党中央和国务院不断深化投融资体制改革,强调投资对于完善
期权是指赋予其购买者在规定期限内按双方约定的价格购买或出售一定数量某种资产的权利合约。期权最早可追溯至古希腊和古罗马时期,在17世纪30年代荷兰“郁金香球茎热”时期,投机炒作的狂潮开启了真正的期权交易的大门,但在1973年4月26日标准化期权合约才诞生于芝加哥期权交易所,在这之后期权就进入了快速发展的阶段。2019年12月23日由沪深300指数衍生出的三大期权上市交易,其中包含了沪深300股指期权
为开发新的业务模式,拓宽经济增长渠道,商业银行开始开展供应链金融业务,但在实际操作过程中,供应链金融风险事件频繁发生。作为供应链金融参与主体的商业银行同时也是风险管控的重要环节。为此,本文选择以商业银行为着手点,对供应链金融风险评价进行研究。首先,提出本文的研究背景及意义,从供应链、供应链金融、供应链金融风险三方面对国内外文献进行归纳及简要评述,简要介绍研究内容和方法并指出本文研究存在的创新和不足
在中共中央政治局第十三次会议上,习近平总书记指出,金融是国家重要的核心竞争力,深化金融供给侧结构性改革。金融供给侧结构性改革的目的之一是削弱金融排斥,构建适应性强、高竞争、更为普惠的金融体系,降低融资成本,促进经济发展。金融排斥的存在会造成金融资源错配,资金利用率低下,抑制具有创新活力和潜力的中小企业发展,加深城乡二元化结构,形成不平衡不充分的发展,这与经济高质量发展的理念相悖。地区之间的发展具有
随着大数据时代的到来,出现数值膨胀的复杂计数数据给普通离散分布模型带来了挑战。该类数据存在大量0值和1值,数据整体呈现偏态分布,对这类数据使用传统离散分布模型会造成拟合欠佳,误差过大的问题,而零一膨胀模型是处理该问题有效的稳健方法。目前国内对此模型的了解度不高,应用范围和研究领域还有待探索,因此本文以推广零一膨胀模型为前提,选择零一膨胀混合分布模型为基础模型,针对研究问题为反映数据特点,分析了不同
受新冠疫情的影响,许多企业生存艰难,开始通过裁员、减少差旅费等方式降低企业的费用支出,降低费用也是企业的生存方式之一。传统观念认为企业费用随业务量的增加而增加,随业务量的减少而减少,且降低的比例和增加的比例保持一致,但是已有学者研究发现在现实生活中企业费用降低的速度小于其上升的速度,即出现了费用粘性。学者们已经从多种角度对其进行了研究,但是从供应商集中度视角研究对费用粘性影响的文献相对少一些。如今