多源跨域移动互联网中用户关系与移动行为研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:jzhiei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网技术的飞速发展,基于用户行为和用户移动性的多源异构数据感知、存储、分析与应用的研究成为大数据时代具有挑战性的课题。一方面,数据量的急剧增加导致了传统数据挖掘算法的性能逐渐下降,数据种类的多种多样使得传统的数据融合和存储的方法无法处理异构型数据;另一方面,数据价值密度低导致了传统数据分析方法优势丧失,数据更新速度加快、时效性高对数据处理与分析的实时性提出了巨大挑战。另外,多源跨域数据的输入与输出过程对实时性要求很高,利用传统的数据感知、存储、处理和分析的一系列方法显然已无法满足用户对实时处理海量、多源异构、高价值、高时效性这四方面数据的需求。如果对海量数据采用云计算的分布式处理技术,对多源异构数据构建情境,恰当的规则控制好高价值数据的输入和输出,高效的软硬件算法和设施结合,或许能较好的缓解大数据时代对用户数据需求所造成的压力,并更好的满足用户的信息需求。本文针对上述基于多源跨域数据感知、融合、存储、分析与应用所存在的问题,以移动互联网中用户行为和用户移动性的挖掘研究为目标展开研究,并分别从用户关系和用户在城市中的移动行为两方面进行了论述。因此,本文的主要贡献包括以下四个方面:(1)针对社交网络中的用户关注行为,提出了一套针对微博用户可信度问题进行评估的方法。其基本思想为:首先提取决定用户可信度的五个重要特征:粉丝数、微博数、关注数、收藏数和互粉数,通过这五个特征来进行用户可信度得分的计算,即利用它们为每一个微博用户给出一个可信度得分的分值,这个评分过程包括用户自评和用户间的互评,从而针对这两类评分过程分别建立了用户自评估模型和用户互评估模型,经过两套计算模型得出用户可信度的最终得分,然后把该分值按照的得分高低进行TOP排序,从而评估出用户可信度的高低;(2)针对城市计算研究中的用户移动性问题,提出了基于位置的移动社交网络中的W5模型。该模型能够较好的描述日常生活中的用户移动行为,它建立的动态情境能够很好的解释用户(Who)何时(When)在何地(Where)做何事(What),其原因(What)是什么的问题。与现有的W4模型相比,其优势在于它建立的动态情境不仅能够解释用户当前情境的行为,而且能够解释用户上一情境的行为,同时还可以预测用户下一情境的行为。其基本思想为:首先提取建立用户移动行为的五个情境要素,即5W。其中,Who、When和Where分别对应于数据集中的user id、check-in time和GPS经纬度坐标,是可以直接获取的数据项,文中称之为显式要素,What和Why由于与用户所发微博内容和主题相关,需要经过文本提取技术对微博文本进行关键词提取,因此是间接获取的数据项,文中称之为隐式要素。情境要素提取后,利用联合概率计算公式对此五要素建立联合概率计算模型,并根据计算公式的推导依次解决情境解释和情境预测问题;(3)针对城市计算研究中的兴趣点推荐问题,提出了基于位置的移动社交网络中的PMR架构。该架构提出了一整套完整的情境感知、情境存储、情境推荐和用户反馈的计算方法。其基本思想为:借鉴已存在的PMJ模型在人工智能认知技术方面的优势,并结合情境相关的计算方法,建立了一套能够进行用户信息的情境感知、情境存储和情境推荐的推荐系统架构,并分别给出架构单元中各组件的计算方法和运作流程,最后通过用户反馈单元对推荐方案的性能进行评估,使得该架构能够动态自适应的修正自我以满足用户的的实际需求;(4)针对城市计算研究中的用户移动性问题,提出了基于用户角色和城市地域结构的互推断模型。该模型分为两个子模型,即通过用户角色推断基于情境要素的地域结构的子模型MUR→RC和通过基于情境要素的地域结构推断用户角色的子模型MRC→UR。基本思想概述如下:通过用户角色和他们经常活动的区域,结合已存在的城市地域结构划分,推断用户在某一时段的活动范围属于城市中的何种地域结构。同理,根据城市地域结构划分结合用户在特定时间频繁活动的区域推断该用户属于何种用户角色。该模型能挖掘用户随时间变化在城市地域结构间活动轨迹的变化规律,且当数据项缺失时,该模型能根据已存在的数据项对缺失数据项进行补充。上述研究的四个方面均是针对用户行为的挖掘研究,其中用户可信度评估的研究属于用户关系行为的研究,W5模型和兴趣点推荐问题是属于用户移动行为的研究,而用户角色与城市地域结构的互推断研究属于用户关系行为和用户移动行为的综合研究。四方面研究的实验均表明,通过建立较好的数学模型,多源跨域移动互联网中的用户行为,是可以被准确地描述和预测,进而被转化实际的产品为改善人类在城市中的生活而服务的。
其他文献
研究目的:一、对比跖痛症患者与正常受试者的足底压力分布和步态特征的差异;二、观察跖痛症患者穿着定制矫形鞋垫治疗前后足底压力和步态特征的改变,探讨跖痛症患者应用定制矫形鞋垫的临床疗效。研究方法:将符合标准的跖痛症患者30名入组实验组,30名健康人作为正常受试者组,收集两组受试者足底压力和步态特征数据进行对比。收集患者治疗前疼痛、足部功能评分及跖痛症临床治疗观察表数据。给予患者穿着定制矫形鞋垫,在治疗
水生植被于自然界中广泛存在,是河流生态系统中非常重要的组成部分。水生植被不仅影响着河流生态系统健康,而且能够抵御水流对河床与边坡冲刷,起到维护河床稳定与保护河岸边坡的作用。因此,在环境水力学领域内,植被水流的水动力学特性已经成为了一个研究重点。在之前的刚性植被水流模拟研究中,学者们选用圆柱形木棒近似地模拟水生植被,然而本文以实际水流中茎秆粗细变化的植被作为研究对象,通过采用理论推导,水槽试验与数值
糖尿病与牙周炎均为常见慢性病。在中国,二十岁以上糖尿病患者率约为9.7%,而牙周炎的患病率在成人中的患病率高达80%以上。糖尿病作为一种系统性疾病通过使大血管和微血管发生病变而导致严重的并发症,大大降低患者生活质量甚至造成患者的死亡。而牙周炎则是成人失牙从而损害口腔咀嚼系统的功能的主要原因之一,甚至还可能成为某些全身疾病的危险因素,如诱发感染性心内膜炎、冠心病、脑卒中等。糖尿病牙周炎的相互关系己被
学位
随着分布式电源和储能装置大量接入配电网,配电网在发生故障之后可以进行重构和孤岛划分,提高故障恢复的水平。为此,提出了一种同时包含重构与孤岛划分的故障恢复方法。建立包含多类型分布式电源、柔性负荷和储能的多时间段故障动态恢复模型,考虑分布式电源和储能的黑启动能力,并计及故障恢复时间和检修次序。利用二阶锥技术将所建模型转换成混合整数二阶锥规划模型。在PG&E69系统上对该算法的有效性进行验证,结果表明,
第一部分:血小板在盲肠结扎穿孔模型中发挥宿主防御功能目的:尽管血小板的经典角色是介导止血凝血的发生,越来越多的研究表明,血小板在炎症及免疫反应中扮演重要角色。尽管血小板在病毒及单一细菌感染引起的肺炎模型中发挥重要的宿主防御功能,然而血小板在多种微生物感染引起的脓毒症模型中是否参与宿主防御依然未得到证实。方法:选用野生型小鼠,经腹腔注射α -GpIbα抗体(血小板清除抗体)及对应的抗IgG对照抗体,
类钙钛矿化合物CaCu3Ti4O12(CCTO)的相对介电常数不仅数值极高(εr>104)且在较宽的温度范围内(100K-600K)基本不随温度变化,因而在微电子器件领域具有较好的应用前景。然而,由于未能观察到类似于BaTiO3的铁电—顺电相变,CCTO巨介电常数的本质机理目前还存在较大争议。对于有一定实用前景的CCTO陶瓷材料,目前已有很多实验证据支持用边界阻挡层电容器(IBLC)模型解释其巨介
本文主要研究了几种基于覆盖的粗糙集(简称覆盖粗糙集)模型.第3章是我们的第一项主要工作,研究了基于覆盖的概率粗糙集(简称覆盖概率粗糙集)模型以及基于覆盖的决策粗糙集(简称覆盖决策粗糙集)模型.首先,我们给出了关于覆盖粗糙集的不确定度量的方法:然后定义基于覆盖的粗糙隶属度,以此为基础建立了覆盖(α,β)-概率粗糙集并研究了它的性质;接着结合贝叶斯决策理论研究了覆盖决策粗糙集模型.第4章是本文的第二项
该文针对机载组网雷达,在单目标跟踪场景下,研究了雷达辐射参数与航迹规划联合优化问题。首先,推导了包含各雷达辐射功率、驻留时间、发射信号高斯脉冲长度和信号带宽等射频辐射参数以及各载机速度、朝向角等平台运动参数的贝叶斯克拉默-拉奥下界(BCRLB)表达式,以此作为表征目标跟踪精度的衡量指标;推导了含有各雷达辐射功率、驻留时间等射频辐射参数以及各载机速度、朝向角等平台运动参数的机载组网雷达被截获概率,以
在科学研究和工程实践领域存在多种类型的优化问题。多峰优化做为其中的一个分支,长期以来被国内外的学者广泛关注。多峰优化的研究目标不仅要在解空间中搜索全部全局最优解,而且在有些情况下需要搜索局部最优解,这给传统的演化算法带来了挑战。因为传统的演化算法所采用的全局选择模式导致种群个体的选择压力增大,致使种群收敛速度较快,但削弱了种群多样性保持能力。为了解决这一问题,多种与传统演化算法相结合的技术被提出,