【摘 要】
:
随着互联网的快速发展,科研人员上传和下载文献的权限愈发自由,越来越多的电子文献资料出现在网络中。然而,如何更加准确、快速的检索用户所需的电子文献资料成为当前科研工作急需解决的一个难题。科研社区网络中隐含着内容丰富的各类实体之间的关联关系,为了提供更加高效、精准的服务,本课题提出基于机器学习的电子文献推荐算法,将社区发现引入电子文献推荐系统,在提供更加精准的个性化推荐的同时有效地改进了协同过滤推荐算
论文部分内容阅读
随着互联网的快速发展,科研人员上传和下载文献的权限愈发自由,越来越多的电子文献资料出现在网络中。然而,如何更加准确、快速的检索用户所需的电子文献资料成为当前科研工作急需解决的一个难题。科研社区网络中隐含着内容丰富的各类实体之间的关联关系,为了提供更加高效、精准的服务,本课题提出基于机器学习的电子文献推荐算法,将社区发现引入电子文献推荐系统,在提供更加精准的个性化推荐的同时有效地改进了协同过滤推荐算法中存在的数据稀疏与冷启动的问题。在科研社区发现这一研究领域,本课题提出一种引入社区度从属偏重的重叠社区发现算法(CODA-BS算法)。在每一次迭代过程中,CODA-BS算法采用信息熵计算节点阈值,利用偏重函数优化标签从属系数,依据标签传播规则进行标签筛选、从属系数归一化,从而检测到更优质的社区。通过在社区发现领域的基准数据集和中国科学技术协会的学术资源与社交平台数据集上进行验证,从实验数据分析结果来看,CODA-BS算法相较于经典的基于标签传播的重叠社区发现算法(COPRA算法)划分社区的准确度更高,稳定性有所提升。在电子文献推荐阶段,课题中引入社区发现的结果,采用一定的策略弥补用户评分矩阵。首先,利用社区发现的领域隶属度来填充用户-领域评分矩阵,然后依据Pearson系数计算用户相似度,以此来改进基于用户的协同过滤推荐;基于文献的协同过滤推荐利用文献隶属领域及作者的领域隶属度等条件,采用一定策略转换为用户-文献评分表,然后计算文献相似度并进行推荐,至此完成融合社区发现的协同过滤推荐;最后提出一种新的思路:将几种推荐模型进行切换式混合,根据数据源的不同,模型会选择不同的推荐算法进行训练,通过这种切换方式,得到最合适的推荐结果。实验结果表明,融合社区发现的协同过滤推荐与切换式混合推荐在科研社区领域相较于基于内容推荐与协同过滤推荐具有更好的实验结果。
其他文献
近两年,受疫情的影响,人们进出公共场合需进行登记与身份验证。目前普遍采用的人脸识别系统易受口罩遮挡的影响。本文从虹膜识别领域出发探索一种面向移动端的虹膜识别方法。与传统虹膜识别方法相比,基于神经网络的虹膜识别方法精度更高、系统鲁棒性更强,但其参数量庞大,对运算、存储需求较高,难以部署在硬件有限的移动端设备上。为解决上述问题,本文提出一种将轻量化网络结构与模型量化技术相结合的轻量化神经网络用于移动端
移动边缘计算是在物联网背景下的一种分布式计算模式,可以将计算、存储以及小型云中心的处理能力转移到网络边缘。本文从移动边缘计算的架构、特性优势,对邻近性与位置获取进行阐述,对几种新兴的应用场景做了分析,进一步讨论了移动边缘计算在未来的发展以及可能遇到的挑战。本文以节点的移动性预测与计算卸载方法两方面开展研究,主要内容如下:设计了基于移动边缘计算的预测服务框架,利用岭回归优化回声状态网络,对移动节点出
图像风格迁移是近年来十分活跃的研究方向,该研究因其迁移结果的多样性,及其特征提取的思想在其他计算机视觉应用中具有通用性,从而具有一定的应用价值和学术价值。水墨画作为我国重要的文化遗产,具有极强的艺术风格特性,是传播中华文化的重要代表。科技和艺术的融合研究是近年的学术热点,为了更好地弘扬民族文化,本文将风格迁移与中国水墨艺术画相结合,基于循环式生成对抗网络(Cycle GAN)提出了一种新的水墨风格
近几年来,随着大数据的热潮,数据分析处理愈发复杂,传统的一些机器学习技术已越来越不能够适用于当前的大部分数据分析任务。纷繁复杂的现象往往需要多变量数据来描述,而这些数据维数高、样本量大,通过降维技术从这些数据中分析出隐含的数据信息,了解数据的本质特征,有助于更好的提供各领域的信息服务。本文通过对高维数据降维以及预测的相关理论和技术展开系统研究,对相关算法分别对比探究。选用传统主成分分析算法(PCA
随着卷积神经网络在图像视频识别等领域的广泛应用,海量的卷积神经网络计算任务需要得到高效的处理。传统的处理器架构,例如CPU和GPU,由于其结构的局限性无法很好地适应神经网络的计算特点。尽管许多相关工作提出了基于近存储计算的深度神经网络专用加速器,但在冯诺依曼架构下,无法从本质上解决存储墙对深度神经网络加速器性能的影响。因此,研究者们提出基于内存计算的深度神经网络加速器来缓解大量数据访存带来的存储墙
冲击地压是一种严重威胁矿井安全的灾害,具有极强的破坏性。当其发生时,工作面或巷道周围的煤岩体在高应力的作用下发生突然破坏,并伴随着巨大声响及冲击振动,振动能量以弹性波的形式向外传递。弹性波中包含有煤岩体受载荷作用引起的内部结构和能量演化等基本信息,对这些信息进行有效处理和运用,对了解地下岩层的能量和结构的变化、破裂时空演化及冲击地压监测预测等具有重要意义。论文针对冲击地压亚失稳产生的弹性波时频域特
近年来,随着云计算、移动互联网、泛在计算技术在软件行业的飞速发展,“万物皆互联”与“万物皆服务”逐步成熟,各领域的可用服务越来越繁荣,海量服务之间的互联互通形成了服务互联网。在此背景下,服务数量日渐增长,服务类型和服务描述呈现多样化,给服务的组织管理和检索效率带来较大挑战。服务聚类方法是一种有效的服务组织管理手段,它能够识别并聚合具有一定相似程度的服务,通过服务集合的划分与服务归类实现服务重组,从
随着我国西部铁路建设的持续进程,围岩条件较差的铁路隧道工程不断涌现,而西部地区往往处于地震频发区,因此,为保证地震频发区破碎板岩铁路隧道的震时安全性和稳定性,对受震害影响较大的隧道洞口段软弱围岩隧道采取一定抗震设防措施是极为必要的。本文依托玉磨铁路扬武隧道,对隧道的施工力学行为和洞口段稳定性控制技术进行了研究,研究结果表明:(1)利用数值模拟和现场监控数据对三台阶带仰拱一次开挖工法的安全性进行了研
建筑业安全生产与人民生命财产息息相关,是各级政府和企业的监管重点。据统计,2012—2018年我国有记载的建筑业安全事故4096起,安全生产形式严峻。而进行科学合理的建筑施工安全风险评价,可以有效防范和控制施工安全风险,避免安全事故发生。本文通过文献研究、案例分析和专家访谈,构建了建筑施工安全风险评价指标体系,应用博弈论将主客观权重结合进行组合赋权,构建了建筑施工安全风险评价改进物元可拓模型,对建
随着国内外建筑业的快速发展,施工过程中无需施加振捣的自密实混凝土,因具有良好流动性、抗离析性和填充性的特点,在造型独特、结构复杂、钢筋密集的工程中应用越来越广泛。同时,近年来由于混凝土的大量应用,导致天然河砂资源日益短缺,由岩石机械破碎制成的机制砂与天然河砂特征相似,可在混凝土中替代天然河砂,为混凝土行业摆脱天然河砂资源短缺的困境提供了新的选择。机制砂可以就地取材,降低了混凝土的生产、运输成本,缩