基于人类行为数据的社会关系语义推断研究

来源 :东南大学 | 被引量 : 1次 | 上传用户:dxc1989120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,社会关系挖掘受到了学术界和工业界越来越多的关注,研究者们希望从社交数据中还原出真实的社交网络原貌,其中非常重要的一项研究就是对社会关系具体语义进行推断。理解社会关系的语义,可以帮助把握社交网络微观动态结构的演化,在实际的应用中,可以用于商业领域的口碑营销、社交平台的好友推荐等。在目前的研究中,大多数工作所研究的社交网络中只包含单一类型的社会关系,如朋友关系、经理与职员关系或者支持关系等,与实际含有多种社会关系的社交网络有较大的差异。同时,在大部分的工作中,研究者只关注于如何在在线社交数据中挖掘社会关系的语义,忽视了对人们在互联网空间之外的交互行为产生的社交数据进行研究。因此,在本文的研究中,我们将对综合有多种社会关系的真实行为数据集进行研究,探索出一个可行的社会关系语义推断模型。在本文所研究的数据集中,包含有同事关系与伴侣关系,为了同时将这两种不同的社会关系与其他社会关系区分开来,本文首先分析了同事关系、伴侣关系以及其他类型关系在交互行为上的差异。从分析得出的结果可以看出,不同类型的社会关系在交互行为的频率、多样性、类型及时间属性上有较大的不同。之后,借助社交网络理论中的平衡理论、网络结构嵌入性和网络结构分散性的概念分析了各种社会关系在网络结构上的特征。在社会关系语义推断模型研究中,本文基于Boosting方法设计了一个可以挖掘行为数据中社会关系语义的模型。为了进一步提升模型的性能,针对Boosting方法的学习算法,本文提出了一种可以评估学习误差网络影响力的算法EIA算法。根据经典的SAMME算法与EIA算法得到了本文提出的EIA-SAMME算法。在本文的最后一部分中,本文首先测试了参数对EIA-SAMME算法性能的影响。在对比实验中,比较了不同学习误差网络影响力评估方法对SAMME算法的影响;对比了EIA-SAMME算法、Logistic算法和SVM算法在社会关系语义推断上的表现,实验结果显示EIA-SAMME算法在社会关系语义推断的能力上表现最优。同时,在实验过程中,还验证了交互行为特征以及结合社交网络理论设计的网络结构特征在各类社会关系推断中扮演的作用。结果显示,在交互行为特征不能很好地描述一些社会关系的差异时,网络结构特征可以很好地弥补这种不足,提升社会关系语义推断模型的性能。
其他文献
黔东南民族地区乡镇初中由于经济条件不足,文化观念落后,语言环境影响,优质教育资源欠缺,推行课改时间晚等原因造成语文写作教学质量相对较差。针对这一现状,本文对黔东南民族地区乡镇初中选取剑河县乡镇中学为例对语文写作教学现状展开实地调查,结合自身在剑河县南哨中学的教学实践所见与反思,探询黔东南民族地区剑河县乡镇初中语文写作教学现状存在的问题症结及原因。通过参阅大量相关文献资料,结合黔东南民族地区剑河县乡
主题模型(Topic Model,TM)作为一种非监督学习方法被广泛应用于主题抽取任务当中,然而它是一种仅以词共现为基础的数据驱动模型,抽取的主题缺乏可解释性和相关性。为了解决这
随着人工智能的迅速发展,未来生活将发生巨大改变,面对伤残人士,行动不便的老年人等需要被照顾的群体,家庭服务机器人将发挥举足轻重的作用。该文对家庭工具的认知及使用也便
移动机器人的视觉伺服镇定控制一直以来都是机器人控制领域的研究热点之一。针对这一问题的研究大部分是基于运动学模型,而很少考虑可以反映机器人本质的动力学特性,并且在控
随着信息技术的快速发展,面向各种复杂应用背景的多传感器信息融合系统应运而生,信息融合技术的研究也愈加受到重视。其中,系统能否准确掌握传感器的实际探测精度,对融合技术
本文以某集团企业网上举报系统为研究背景,结合该企业的现状,对网上举报系统相关业务流程进行了梳理和分析,分析了系统角色和系统基本业务流程,结合UML用例对系统功能进行了
近年来,随着计算机和网络技术的普及和飞速发展,计算机网络已成为人们日常工作、生活及学习中必不可缺的一部分,同时学校的教育教学手段也发生了很大的改变,远程教学、辅助教
宫颈癌(cervical cancer)是常见女性恶性肿瘤,其中人乳头瘤病毒(human papillomavirus,HPV)与90%以上宫颈癌发生相关。高危型HPV持续感染能高度活化宫颈上皮细胞中AKT,高度活化的AKT促进宫颈癌细胞的增殖和生存,最终诱导肿瘤的发生。异莲心碱是睡莲科植物莲的成熟种子中的胚芽中提取出来的一种双苄基异喹啉生物碱。研究发现异莲心碱具有显著的抗肿瘤活性。但是异莲心碱对
近年来,随着定位技术的发展和无线传感器的迅速普及,众多具有定位功能的无线手持设备和车载设备大量普及,使得许多新的应用可以产生大量的运动信息,这些随时间变化的位置信息
随着无线视频传输在许多应用中变得越来越重要和流行,例如移动电视、视频监控和在线教育等,传统的数字通信系统将面临两大挑战:数字视频编码方面的“质量饱和效应”和数字信