基于技能兴趣网络的计算机类博文推荐算法研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:adamadama
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
IT技术交流社区是广大技术爱好者和从业人员交流和分享计算机与互联网技术的重要平台。技术社区中的用户每天都会产生大量的技术文章,以及浏览、收藏、评论、点赞等行为。从用户产生的历史数据中分析出用户兴趣与技能的变化,有助于技术社区为用户提供更精准的个性化服务,这对用户和技术社区都有着重大的意义。传统的推荐算法往往着眼于“用户-物品”的关联关系进行研究,而较少考虑用户与物品发生关系的时间顺序。而将用户历史行为视为时间序列数据进行推荐的模型多数是在用户的兴趣层面建模,而技术社区中的用户不仅拥有兴趣特征更拥有技能特征,在推荐中兼顾用户的兴趣与技能成了一个值得探索的问题。IT技术社区中的文章多数是计算机领域的技术文章,计算机领域发展更新较快,常常出现一些新的技术词汇,并且一些专有名词在社区中拥有特定的简写表达,直接使用分词工具不容易从文章中识别这些词,需要使用辅助分词的计算机领域专有名词字典来提高分词的准确性。针对计算机领域不断出现新词的问题,本文设计并实现了一种用于计算机领域新词发现的算法来扩建计算机领域专有名词字典。技术社区中的博文以Markdown的格式存在,一些原本属于停用词的符号在博文中成了Markdown的语法标记,用以增强词的语义表示。针对Markdown文本的这一特点,本文提出了语义块的概念并设计实现了一种Markdown特征来提升无监督关键词提取的准确性,使用Markdown特征改进了TFIDF算法和Text Rank算法,并在改进算法的基础上设计实现了基于Markdown特征感知的无监督关键词提取算法(MDKE)用于提取Markdown格式的文章关键词。考虑到技术社区中的用户既是文章的作者又是文章的读者,作者体现用户技能输出,读者体现用户的兴趣取向,本文将用户点赞的文章视为用户兴趣取向,将用户发表的文章视为用户的技能取向,并考虑用户点赞行为和发表文章的时间顺序将用户行为视为时间序列使用LSTM模型提取用户的兴趣特征和技能特征。考虑到用户的职业、是否为领域作者等静态特征对推荐结果也会产生影响,使用了MLP模型来提取用户静态特征的高阶表达。最后融合了用户静态特征、用户兴趣特征和用户技能特征提出了一种基于用户兴趣技能网络的计算机博文推荐模型(SKAIN),同时兼顾用户的兴趣与技能。本文在掘金网的真实数据集上设计了实验。首先,将MDKE算法与主流的关键词提取算法进行了比较,验证了MDKE算法在Markdown格式的文本中提取关键词的有效性;其次,本文为SKAIN模型设计了对比实验,进一步验证了结合用户技能特征和兴趣特征的SKAIN模型在计算机博文推荐中的优势。本文的研究为无监督关键词提取以及技术社区文章推荐拓宽了新的思路。
其他文献
分别选用3种不同型号的大孔强酸强碱性阴阳离子交换树脂,采用浓缩室填充树脂的强化电去离子(EDI)过程,对低浓度Ni SO4溶液进行了浓缩分离与同步纯化。考察了树脂电阻、交换容
随着互联网时代的到来和信息科技的进步,大数据时代所带来的信息过载的问题日益严重。用户很难从海量的图像、视频、文本和商品信息中找到适合自己个性化需求的信息。个性化
超热区中子的弹性散射易受靶核热运动影响,传统的蒙特卡罗程序采用常数散射截面自由气体模型来描述超热区中子的散射过程。研究表明,忽略共振弹性散射效应所引入的误差随温度
近年来在我国青少年中出现相当程度的诚信危机。诚信品格的培养是个人发展的需要,也是社会发展的需要,加强青少年的诚信教育必须由全社会共同努力,积极探讨诚信教育的途径和
快速、高效、经济地清除放射性污染是核应急处置、污染场址修复的重点研究内容。从放射性污染土壤中提取、遴选出3种耐辐射真菌F3、F7和F16,研究了其对钚的吸附分离性能。3种
水系锌离子混合电容器,因其同时具有锌离子电池高的能量密度和超级电容器高的功率密度以及超长的循环稳定性,是很有发展潜力的安全储能技术,现已引起学术界的广泛关注。目前开发高性能锌离子混合电容器的主要难题是寻求高比电容电容型电极材料和有效利用的锌负极制备方法以及开发宽窗口电解液体系。因其无毒、廉价、良好的循环寿命和优异的功率输出,商用活性炭被广泛用作锌离子混合电容器电容型电极材料。然而,由于其各级孔隙之
<正>传统的篮球课堂教学的实际教学效果并不理想,学生没有兴趣,而且还常容易受伤。学生即使学会了某些基本动作,但是也不知道如何应用,加之有些学校器材较少,在篮球教学时,学
为探索卷烟主流烟气中重要碱性香气成分对彰显卷烟风格特征的作用和贡献程度,采用烟用香料作用阈值感官评价方法,评定了25种吡嗪和吡啶类重要碱性香气成分(25种碱性成分)的作用
为解决三级四段式真空回潮机蒸汽消耗量大等问题,采用汽机联用技术对其抽空系统进行了改进,将真空回潮机的三级、四级蒸汽真空泵改为由电机驱动的水环式真空泵,根据箱体压力
明确引起烟支霉变的微生物及其生物学特性,从霉变烟支中分离到4株霉菌。采用真菌形态学和rDNA-ITS分子标记相结合的方法,对这4株霉菌进行鉴定,并对其生物学特性进行研究。结果表