大数据联盟数据资源群推荐研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:ftpp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着大数据、物联网等信息技术的快速发展,数据逐渐成为企业发展所必需的重要资源,但由于企业所拥有的数据资源有限,且获取成本过高,导致其发展受到严重制约。为解决企业数据资源困境,多个企业联合组建形成了大数据联盟。大数据联盟内部数据资源共享,有效提高了数据资源利用效率,但随着大数据联盟规模不断扩大,联盟数据资源和用户随之增多,巨量的数据资源引发信息过载现象,导致用户难以在短时间内准确获取所需数据资源。推荐系统的引入有效缓解了大数据联盟数据资源交易过程中的用户选择困惑,但面对大数据联盟庞大的用户群,传统的个体推荐所带来的成本过高、数据稀疏型用户推荐准确率过低等问题,导致个体推荐不再适用于大数据联盟数据资源推荐。在此背景下,本文将群推荐引入大数据联盟数据资源交易中,通过将联盟用户分群,为用户群提供符合需求的数据资源推荐列表,提高推荐效率,降低推荐成本,推动大数据联盟数据资源交易发展。本文以大数据联盟为研究对象,通过分析大数据联盟、数据资源、群推荐的研究现状,挖掘联盟用户的数据资源需求,基于大数据联盟数据资源特点及用户需求设计大数据联盟数据资源群推荐过程模型。在大数据联盟数据资源用户分群时,为确保分群后的同一群内用户在长期偏好与近期需求都具有较高相似度,本文通过聚类用户画像形成群体画像实现初次分群,并在群体用户画像的基础上结合用户近期需求对用户进行二次分群。用户分群后,由于部分用户数据稀疏,难以为其准确提供所需数据资源,导致用户满意度不高。为保证推荐结果能够在用户群整体满意度较高的同时部分成员不满度最低,采用改进的VIKOR算法对与用户群需求匹配后筛选出的候选数据资源进行折衷排序形成数据资源推荐列表,推送给用户群。最后以中关村大数据产业联盟作为实证研究对象,验证大数据联盟数据资源群推荐的可行性。大数据联盟数据资源群推荐研究有利于提高联盟数据资源利用效率,挖掘用户价值,促进数据资源的流通与应用,为多主体协同进行群推荐研究做出一定的理论贡献,对大数据联盟数据资源交易稳定发展具有重要现实意义。
其他文献
随着移动互联网飞速发展,以短文本为载体的信息数据不断增加。有效信息的筛选和利用是短文本挖掘的主要目的,短文本自动分类能够帮助用户快速定位文本内容并有选择性地处理海
超可靠低时延通信(Ultra-Reliable and Low-Latency Communication,URLLC)是第五代移动通信(5G)的应用场景之一,其物理层的设计方案将直接影响低时延和高可靠指标的实现,因此
情绪在人类日常交流中起到非常重要作用,在对话场景中进行情绪识别的研究有巨大的商业价值和研究意义。本文利用当前比较前沿的深度学习技术,主要研究了多人对话场景中的多模
在磁随机存储、纳米振荡器以及自旋逻辑器件领域实现快速低功耗控制磁矩是自旋电子学主流研究方向。电流驱动的自旋轨道矩效应作为自旋操纵磁矩的一种新的有效手段掀起了自旋
实际生活中,由于条件限制,当响应变量大于或小于某一阈值时,往往观测不到响应变量的真实值,此时,可以用Tobit模型来分析这类数据。参数模型是研究响应变量和自变量关系的一种有效工具,且优点众多,如精度高、解释性好、预测准确,因此本文考虑参数Tobit模型的有关问题。另外,由于测量设备、测量方法等因素会导致观测值带有测量误差,所以研究协变量有测量误差的参数Tobit模型是有意义的。回归模型的参数估计在
在现代通信中,语音会不可避免的收到外界环境干扰,这些干扰和干净语音在时域和频域上相互叠加,会造成通信质量下降,语音增强就是为了把收到干扰后形成的带噪语音尽可能还原为
在大数据时代,为了保证海量数据访问的安全性和便捷性,越来越多的人选择将个人有价值的数据存储在云端。然而,目前的云端服务往往由单一服务商维护,存在中心化服务器一旦被攻
对于铁磁金属的磁电阻,传统认为它来自于磁化强度M方向和外加磁场H两方面的贡献,由于M的方向与H有关,所以研究它们各自的影响是一个尚未解决的问题。通常,饱和磁化下多晶材料
行政诉讼原告资格是行政诉讼制度的基础,当下新《行政诉讼法》以“利害关系”作为界定原告资格有无的核心要件,但是针对“利害关系”定义,以及认定“利害关系”的途径并未明确规定,因而理论界与实务界并未就此形成统一共识。同时,源流于德国的保护规范理论,为我国判断原告资格实务运转增添了一种全新的模式。在本土化的尝试上,虽然有“刘广明案”为先导并在2018年奠定了规范基础,但作为“舶来品”的保护规范理论由于根植
行人再识别是指对不同摄像机视角下的同一行人进行识别匹配的研究。该技术主要应用于智能视频监控系统中,在计算机视觉领域中具有重要的学术意义和应用价值。由于近年来大数