【摘 要】
:
传统的机器学习通常要求有大量的有标签数据,然而这在一些场景中常常无法满足。例如,在多网络关系预测和推荐任务中存在冷启动(Cold Start)问题,即新网络中存在较少的边和关系数据,这使得普通的监督学习框架难以获得很好的训练效果。迁移学习和主动学习是两种解决标注数据不足的重要方法。在多网络关系预测中,迁移学习利用源网络中的关系信息帮助目标网络的关系预测任务,主动学习用于查询目标网络中有价值的节点对
论文部分内容阅读
传统的机器学习通常要求有大量的有标签数据,然而这在一些场景中常常无法满足。例如,在多网络关系预测和推荐任务中存在冷启动(Cold Start)问题,即新网络中存在较少的边和关系数据,这使得普通的监督学习框架难以获得很好的训练效果。迁移学习和主动学习是两种解决标注数据不足的重要方法。在多网络关系预测中,迁移学习利用源网络中的关系信息帮助目标网络的关系预测任务,主动学习用于查询目标网络中有价值的节点对样本的真实标签,将其加入数据集中迭代训练。在多源数据推荐系统中,采用辅助数据的协同推荐(Collabrative Recommendation with Auxiliary Data,简称CRAD)综合用户的社交网络以及浏览记录提高系统的推荐效果,迁移学习利用辅助数据学习用户偏好信息,主动学习用于查询更能体现用户偏好的物品评价。本文针对上述任务提出以下两个独立的方法:(1)基于主动迁移学习的多网络关系预测方法TAQIL;(2)基于主动迁移学习的推荐系统TACF。第一个工作将源网络中的节点信息迁移到目标网络中,训练得到一个初始模型,然后从目标网络的无标签数据中选择信息量最大的数据进行标注,将其加入数据集再次训练,重复上述步骤直到查询代价用完。第二个工作使用迁移学习从用户的浏览记录中学习用户的偏好信息,并将这些信息用于协同过滤学习获得初始模型,同时允许系统查询用户对某些物品的评价,将其加入评分矩阵中,根据最新添加的评价信息更好地学习用户偏好特征。关于多网络关系预测的实验结果表明,TAQIL方法在非网络数据、网络数据上,比现有的方法具有更高的分类准确率。关于多源推荐系统的实验结果表明在MAE和RMSE两种评价指标中,TACF方法在推荐数据集MovieLens和MovieRating上具有更好的推荐效果。
其他文献
西门子PLC以太网通讯的类型有ISO、ISO-on-TCP、TCP/IP、UDP等多种传输协议,采用何种性能的以太网取决于工业用户的需要。本文主要阐述了工业以太网模块在西门子PLC系统中的
下尿路感染是临床泌尿外科常见感染性疾病,多由于各种病原微生物侵入泌尿系统引起炎症反应,临床常 采用抗菌药物治疗[1]。但近年来尿路感染的病原菌耐药情况愈发严重,临床抗
建筑行业从2016年5月1日开始实行营改增至现在已经有两年多的时间了,以往建筑企业以缴纳营业税为主,而2016年的税制改革全面影响了建筑企业的税制、税务管理和资金等方面。在税改后,大多数的建筑企业税负没有减轻反而增加了,对企业的经营和利润目标的实现造成了负担。本文根据相关财税法规与政策,结合增值税与纳税筹划的基本理论,运用文献研究法、实地调查法等,通过分析ZT建筑安装公司增值税纳税现状与纳税存在的
重金属污染问题已成为全球热点,会对野生动物及环境造成严重危害。野生动物体内重金属主要来自食物链的传递,植物从空气和土壤中吸收重金属离子及其化合物,被采食后富集到草
目的分析PICC原位换管的效果及护理体会。方法选择我院收治的PICC原位换管患者50例,依据护理模式差异性将所有患者均分两组。开展基础护理的25例患者为参照组,开展综合护理干
落葵又名木耳菜、胭脂菜。近年来作为稀特菜引入北方。以嫩茎叶为食,可炒食或煮汤,营养丰富。一、对环境条件的要求落葵属喜温蔬菜,耐热耐湿性较强。在中性或偏酸性的疏松壤土中
本文对条件致病真菌感染、真菌感染的类型、途径与检查等进行了简述,并具体对毛发癣菌、石膏样小孢子菌、猫鼻曲霉菌病、猫念珠菌病、全身性真菌感染疾病、犬组织胞浆菌病、犬
财经类院校根据自身特点可对信息与计算科学专业定位为:培养具有良好的数学基础和数学思维能力,掌握信息与计算科学的基础理论与方法,受到科学研究的严格训练,将信息技术和计算科
伴随着经济的快速发展,企业之间的竞争不断加剧,若想确保在激烈的竞争中处于不败之地,则必须充分发挥员工的能力。著想有效的实现上述目标,则必须通过制定严格的绩效管理制度,对员
应激性心肌病是一种好发于围绝经期后女性患者,与心理或躯体应激相关,具有短暂性左心室收缩功能障碍特征的获得性心肌病。该病病理生理机制尚未完全阐明,可能的机制主要包括: