论文部分内容阅读
本文主要从三个方面切入来对基于语义的构建个人知识网络过程中涉及到的技术进行分析和提出改进方法。分别为知识单元的发现,知识单元的搜索和排序,知识单元的推荐。在知识单元的发现方面,我们提出动态关联主题模型来随着时间的变化来对知识单元进行分析,其模型将高维度的观察空间中的词组集映射到低维度的主题潜在空间来提高空间利用率的同时缩小了用户目标空间范围,分解为词组集合的知识单元来源于会议或者期刊论文集等知识库。主题和关系的动态由临时先验概率分布获得,以此来通过关系潜在空间构建层次结构,所有的变量包括词组、主题和相互关系在不同的时间段动态存在,我们提出的模型是非参数化的可以表现更为高效的收敛速度。动态关联主体模型对于发现特定主题中的词组概率分布并预测主题和相互关系的走势方面表现出色。降低的主题空间对提高知识单元的聚类也有很大帮助。在知识单元的搜索和排序方面,我们提出基于语义上下文对知识单元的协作搜索,通过对语义上下文来进行概念标注用户本体和知识领域本体,并表明此方法可以明显提高搜索和排序的质量,并将用户的搜索习惯考虑在我们的方法中来构建用户与用户之间的语义关系和分析兴趣相似度,并提出根据用户的属性分为标记知识单元的用户和查询知识单元的用户来进行聚类,通过此来平衡处理时间和空间利用。在知识单元的推荐方面,我们提出将领域知识本体集成到用户使用挖掘和推荐过程中,这样的集成方式增加了对领域知识细节的解释能力。领域本体结合用户提供的标签来提供top-n推荐,并且提出基于语义的序列模式挖掘算法,来减少执行时间和降低内存使用。提出包含语义信息的马尔科夫转换概率矩阵来对知识单元进行预测。