社交网络用户职业画像方法研究与应用

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:longweii
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络平台已成为互联网服务中不可或缺的重要组成部分。随着用户数量的爆炸性增长,社交网络的数据规模不断扩大,这使得用户画像成为研究热点。目前,对用户画像技术的研究在电子商务、新闻媒体等领域已经有了非常丰富的成果,但现有的研究工作缺少对用户职业画像的研究与应用,本文基于职业社交网络数据分析用户职业适应性、职业技能聚类特征及相关应用,主要内容如下:(1)基于职业社交网络数据分析了用户的职业适应性。本文首先采集了64442份Linked In会员的个人档案,每个档案都包含用户的个人兴趣,职业技能,工作经历等其他信息。然后对用户填写的所有兴趣和技能数据进行标准化处理,通过同义词聚类筛选出214个高频兴趣和4764个高频技能。接着建立关联分析模型并挖掘多维关联规则,揭示了不同兴趣和技能之间的关联和依赖关系,分析了人类兴趣和技能之间的关联特征与职业适应性的关系,并验证了这些关联规则对用户职业适应性的影响。最后,列举了职业适应性分析的使用场景,并讨论了实验结果的应用价值和发展前景。(2)研究了职业技能生命曲线的聚类特征。本文对采集的用户数据进行提炼并统计出职业技能在各年龄段用户群体中的被认可程度,从而生成每个职业技能的生命曲线。接着利用一种结合密度峰聚类算法和K-Means聚类算法的混合聚类算法对职业技能生命曲线进行聚类,挖掘出具有相似生命曲线的职业技能,并设计了三组实验验证了混合聚类算法的效果。(3)探究了社交网络用户职业画像方法的应用。本文介绍了基于海量社交网络数据的人物画像系统,对系统的项目背景、总体架构以及部分原理进行了详细说明,阐述了职业适应性研究在用户画像系统中的应用,并展示了系统的部分可视化效果。本文还将兴趣爱好与职业技能的关联规则应用到职业推荐算法中,通过对比实验证实了关联规则能够在一定程度上解决推荐算法的数据稀疏性问题,并提高职业推荐算法的准确度。本文的研究成果可以佐证人类的兴趣爱好与职业技能之间存在着大量的关联关系与聚类特征,这些数据特征可以在基于社交网络大数据的职业推荐系统、人物画像系统等实际应用场景中发挥良好的应用效果。此外,本文的研究成果对社交网络用户属性挖掘具有借鉴意义。
其他文献
2015年以来,国家创新财政支农新方式,由财政资金出资,建立政策性农业担保机构,解决传统金融支农力度不足的问题。担保行业是一个高风险行业,农业项目还具有投资周期长、利润低、不可抗力风险大等特征,决定了农业政策性担保机构面对极大的市场风险和特殊的政策风险。若无科学、高效、全面的风险管理体系,政策性农业担保机构必然面临巨大的风险挑战。山东农担公司于2017年12月成立,成立时间较晚,各项风险管理制度不
约翰·巴思(1930—)是当代美国文坛一位重要的小说家,其作品具有明显的反讽、戏仿和先锋实验性等特点。自1950年代开始发表小说以来,巴思笔耕不辍,通过自己的创作反映了不同历史时期的时代特征和文学思潮。1966年问世的《羊孩吉尔斯》是他第一部畅销作品,也得到了学界的一定关注。目前对这部小说的研究仍有一定局限,研究者们主要探讨了巴思具有实验性质的后现代主义文学创作技法,或从哲学、神话学角度来阐释作品
目的:应用理气通腑法自拟方治疗不稳定型心痛合并便秘(肝郁腑实型)的临床疗效观察。材料与方法:对符合冠心病不稳定型心绞痛合并便秘(肝郁腑实型)诊断标准的试验组和对照组各33例共计66例患者采取随机数字表进行法随机分组。对照组:予以西医常规标准化治疗方案和对症处理,予以抗血小板聚集、硝酸脂类、β受体阻滞剂、降脂类药物及对症支持治疗。治疗组:在对照组相同治疗方案的基础上联合理气通腑法(自拟方)治疗,每日
背景:乳头溢液是乳腺疾病的常见三大主要症状之一,其发生率约为5%-8%[1],临床上常见的乳头溢液种类多样,包括乳汁样、多色粘稠性、脓性、水性、浆液性、浆液血性、血性等,其中80%-90%的乳头溢液为良性病因所导致,主要包括乳导管炎、乳腺导管扩张症、导管内乳头状瘤及乳腺增生症等[2]。中医和西医对于乳头溢液的治疗方法区别较大,对于导管内占位性病变,西医目前以手术为主要治疗方式。临床实践中发现大多数
在高寒地区,寒冷是制约畜禽产业发展的重要因素之一,对动物的生产性能、抗氧化系统、免疫系统以及神经内分泌系统等方面产生影响。为了缓解冷应激对肉鸡的不利影响,我们采用温和冷刺激的方法对肉鸡进行训练,以免疫性能作为筛选指标,旨在找到提高肉鸡免疫机能和抗冷应激能力的最佳冷刺激方法。本研究以400只罗斯308肉雏鸡为研究对象,随机分为1个对照组和4个冷刺激组。对照组采用传统饲养温度饲养,冷刺激组则采用比对照
在我国教育体系中,职业教育是不可或缺的重要组成部分,中高职贯通、高本贯通是我国职业教育改革和发展的必然要求。“中高职贯通”人才培养模式为作为应用型人才培养模式的一种,在职业教育和培训体系中是最基础,也是颇为重要的一部分。中高职贯通教育人才培养模式是国家职业教育改革中的一项工作,通过中职与高职两校间的贯通来培养人才的一种模式,专业通过一体化设计,达到加速培养职业教育人才的目标。中高职贯通人才培养政策
分蘖成穗是小麦的重要生物学特性,明确其遗传机理,筛选和发掘与分蘖成穗相关的主效QTL位点和分子标记,对于小麦遗传育种工作具有重要的理论和实践意义。本研究以协调型1BL/1R
回归测试在软件集成开发过程中起着非常重要的作用,同时也会消耗很多时间和资源。测试用例优先级排序技术通过优化测试用例的执行顺序,能够达到优化测试用例集,降低回归测试成本的目的。进化算法和群智能算法能够较好地解决测试用例优先级排序问题,但其存在易陷入局部最优、算法稳定性不强等通病。当今的软件测试通常会利用测试脚本或自动化测试工具来完成,测试过程会产生大量的测试日志。为了更好地利用测试日志中的信息来优化
地质公园景观资源能够帮助人们了解地质现象,推测范围内地质演变,学习地质演化的历史,汇集科学价值与美学价值。云南省兰坪县罗古箐地质公园景观资源多数由新构造运动作用形成,地处西南边陲三江并流地带,是研究西南地区地质构造形成与演变的重要依据与资源。研究区属于国内新生地质公园,发展处于萌芽阶段,通过细致的自然景观资源评价与保护,让珍贵地质景观资源得到更加科学合理的开发与利用。通过野外调查与室内研究结合,收
目的:(1)探讨不同证型的原发性头痛与类型之间的相关性。(2)探讨不同证型的原发性头痛与情绪障碍、睡眠障碍之间的相关性。(3)探讨不同类型的原发性头痛与情绪障碍、睡眠障碍之间的相关性。方法与对象:对2019年1月到2020年1月于天津中医药大学第一附属医院老年病科门诊等符合原发性头痛诊断及排除标准的病例采用头痛影响测评量表-6(headache impact test-6,HIT-6)、Willi