基于社交网络用户感知的众包数据应用

来源 :武汉大学 | 被引量 : 0次 | 上传用户:liqihua2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络为用户群体提供一个利用集体思维解决具体问题的平台。众包系统可视为一个目标明确的小型社交网络,用户基于公众兴趣、公共利益自愿聚集在一起,在其中贡献感知体验、创建知识库,并利用网络的社交功能实现共同目标。共同目标包括基于集体智慧还原热点事件、利用分布式感知数据源求解大规模问题等等。基于社交网络用户感知的众包模式是社交网络与众包感知相结合的产物,满足开放式协作众包模式(Open Collaboration Crowdsourcing)的特征。基于此,本文将社交网络用户群体视作众包感知数据源,并将其贡献的感知数据划分为基础、关键、扩展三个层面,其中基础层面对应于面向日常社交互动的众包实体信息,关键层面对应于面向协同群智感知的众包感知数据,扩展层面对应于面向用户关注领域的众包事件描述信息。三个层面的众包数据对于用户特征还原、高质量数据采集、热点事件追踪等意义重大。本文开展基于社交网络用户感知的众包数据应用研究,重点研究内容可概括如下:(1)基于众包实体信息的跨网络实体识别。众包实体信息包括异构属性信息及关联结构信息,可用于识别跨网络实体间的隐含对应关系,即匹配同一用户的跨网络账户。本文针对跨网络的用户及其关联实体的识别问题,引入网络节点特征的学习及匹配,提出了一个基于矩阵分解的联合表征学习模型MFRep(Matrix Factorization based Representation learning)。MFRep模型考虑了真实网络中关联结构的差异性,以相互促进的方式同时识别多实体的跨网络对应关系。基于众包实体信息的跨网络实体识别还原了用户及其关联实体的特征信息,有利于构建全面的用户画像。(2)基于众包感知数据的众包团队形成。基于众包实体信息还原的用户在线足迹可作为线索,收集用户在群智感知应用中贡献的历史感知数据。众包感知数据包括环境信息感知等数值型数据,及消费者调查/产品评论等类别型数据。本文提出了一个众包团队组建机制QEM-Crowd(Quality Estimation Model for team Crowdsourcing),包括感知质量评估模型QEM(Quality Estimation Model)和任务分配算法CSSelection。根据用户的历史感知数据,QEM模型有效衡量了用户针对不同任务的价值贡献。通过将众包任务价值最大化问题建模成背包约束下的次模优化问题(Submodular Cost Submodular Knapsack,SCSK),CS-Selection算法完成专业知识不同的多用户招募,在保证团队连通性的同时,得到了次模优化问题的近似解。(3)基于众包事件描述的事件检测追踪。众包团队成员贡献的感知数据可视为众包任务相关话题/事件的文本描述信息。众包事件描述信息来源于众包感知数据及用户参与的话题讨论。社交网络用户可视为社会热点事件的众包传感器,其贡献的众包事件描述包括热点事件的检测指标,事件的内容变化及事件的时空特征。基于不断生成的众包事件描述信息,本文提出了一个面向用户关注领域的事件检测追踪框架CyberEM(Event Evolution Model with respect to Cybersecurity domain)。该框架利用语义完整的语言结构表征并检测热点事件,并通过事件聚合算法探究潜在演化事件,以追踪热点事件的后续发展。综上所述,本文全面探讨了基于社交网络用户感知的开放式协作众包模式及其应用价值,为解决基于社交网络用户集体思维的具体应用问题提供了新的途径。
其他文献
随着我国经济的飞速发展以及全球化的加速进行,在工业生产、经济活动、气候变化、能源生产分配、交通运输等各个领域中都产生了大体量、多类别、多维度的海量数据。其中,时间序列数据能够客观有效的反映各领域中不同现象和活动的变化过程,其背后蕴含了丰富的演变规律。对这些时间序列数据进行分析和研究便可从中学习和总结出相关的数据变化规律,而若能有效的掌握这些规律并且将其运用于实际的生产生活等活动中,便可实现优化资源
光纤表面等离激元共振(Surface Plasmon Resonance,SPR)传感技术是一种高灵敏度、操作简单及可在线检测的光学检测技术,并且具有免标记、不破坏样品成分的优势,被广泛应用于食品安全、医疗诊断和环境监测等诸多领域。葡萄糖、氨基酸和重金属离子等生物活性分子和离子作为诊断疾病、监测生物体生命活动的标志物,在生命体中的含量与人类健康息息相关。生物活性分子和离子的高精度动态检测对实现相关
随着分布式电源、电动汽车等新技术的快速发展,大量新设备接入配电网,推动着配电网向分布式、共享式、供电商和用户双向互动的智能配电网方向转变。新型配电网庞大且复杂,传统集中式保护和控制方法已经无法满足需求,分布式保护和控制方法具有逻辑简单、可靠性高和扩展性强等优点,是智能配电网的发展方向。但是,分布式算法依赖通信和决策去中心化的特点改变了传统建模和仿真的基础,使得原有分析方法不再有效,智能配电网分布式
目的:MYC在肿瘤的发生发展过程中发挥非常重要的作用。当在MYC诱导的肿瘤模型中阻断其表达时,肿瘤生长会出现抑制甚至完全衰退,这提示靶向MYC可有效抑制肿瘤发生发展。然而,直接靶向MYC的抑制剂目前没有开发成功,间接靶向MYC成为替代策略。MYC高度激活诱导癌细胞G1期检查点失活和基因组不稳定性上升以促进肿瘤发生,但也导致肿瘤细胞内复制压力过高。为了逃避过度的复制压力引起的细胞凋亡,肿瘤细胞会更加
农药创新对于虫害防治至关重要,现有的化学农药面临着产生抗药性快、人畜毒性大等一系列问题,究其根源在于靶标种类单一,因此农药创新的关键在于靶标创新。昆虫的生长发育伴随着周期性的几丁质重塑过程,对昆虫几丁质代谢系统中的关键酶进行干扰被认为是虫害防治的有效手段之一。在昆虫体内,参与表皮几丁质降解的关键酶主要为糖基水解酶18家族几丁质酶,包括几丁质酶Ⅰ号酶(ChtI)、几丁质酶Ⅱ号酶(ChtⅡ)和几丁质酶
单核细胞增生李斯特氏菌(Listeria monocytogenes,L.monocytogenes),是一种重要的食源性致病菌,由其引发的李斯特菌病已经对人类健康和安全产生了严重危害。该菌除了能在低温、酸性或者高盐分等环境中生存,又能粘附于食品加工设备表面形成难以清除的生物膜。本研究选取中国的14种主要柑橘栽培品种,提取其精油(Essential oil,EO)并分析组成成分,通过比较不同品种精
驾驶员监控系统可有效提供有关驾驶员注意力、车辆操纵和控制状态等参数的重要信息,而识别系统往往都需要专用的高成本设备才能达到识别性能。现如今,除了使用传统的摄像头或可穿戴设备,用于驾驶员状态和手势监控方面等无线技术也得到了广泛的关注。由于WiFi信号的细粒度信道状态信息(CSI)的普遍存在,受此启发,我们利用WiFi设备,实现不需要携带硬件设备的低成本驾驶员状态和手势识别,此外,该方法不需要特殊的硬
与纯铝或铝合金相比,颗粒增强铝基复合材料(PRAMCs)因具有较高的比刚度和比模量、较低的热膨胀系数、良好的高温性能和抗蠕变性能及较好的耐磨损性和抗疲劳性能等特点而被广泛应用于航空航天、武器装备、汽车及电子等领域。进入21世纪以来,PRAMCs的应用范围被进一步扩大,各领域对PRAMCs的比强度、比刚度和轻量化提出了更高的要求。此外,为了满足不同领域的要求,由PRAMCs构成的重大装备核心部件通常
钢渣中含有多种碱性含钙矿物,使其具有较高的固碳潜力。通过碳酸化可制备出力学性能良好的钢渣建材制品,但产物碳酸钙对制品强度增长的贡献机制尚不清晰,对碳酸钙的晶体生长规律的研究有助于更好的理解自然界成岩过程。此外,碳酸化对钢渣浸出液pH的中和作用有助于提升钢渣制品的环境友好性。本文进行了以下方面的研究:1)以β-C2S及C3S为主的硅酸盐相的碳酸化是钢渣碳酸化制品强度的最主要来源,这得益于碳酸钙的生长