论文部分内容阅读
专利文献包含丰富的创新信息,是重要的知识载体,具有重要的参考价值。阅读行为能在一定程度上反映用户的兴趣所在。通过知识图谱与定性研究方法相结合来分析国内外研究现状,发现基于专利文献阅读行为的研究目前处于空白。本文主要利用专利文献自身特有的编排体例和内容特征,通过对用户专利文献阅读行为的实验分析,挖掘其对专利文献要素的兴趣拓扑结构,构建兴趣模型指标,计算兴趣度;再挖掘用户平时阅读的兴趣关键词及其所对应的国际专利分号(IPC)小类、结合利用兴趣拓扑结构设置关键词位置权重,发现待推送的专利文献。本研究具体包括以下几个方面的内容和创新。(1)分析了国内外阅读行为兴趣研究知识图谱。选择Web of Science数据库中阅读行为兴趣研究的相关文献,利用CitespaceⅢ、Hist Cite软件及数据库在线分析功能进行分析和处理,揭示基于阅读行为兴趣研究的跨学科属性、重要区域、机构、研究热点、高影响力著者、代表性文献及核心刊物。(2)构建了用户专利文献阅读行为兴趣的理论模型。利用Tobii T60XL对阅读眼动数据进行采集、处理与分析,以发现用户对各兴趣区的偏好差异;通过对视线扫瞄轨迹采集用户在阅读过程中的视线扫瞄模式,进一步确定了兴趣模型指标,具体包括:相对访问时间、相对注视次数、瞳孔直径缩放比和回视次数;采用改进的层次分析法对兴趣模型指标进行权重设计,提供了构建用户专利文献阅读兴趣模型的一般方法。(3)挖掘用户专利文献阅读兴趣并进行拓扑结构表示。进一步以Tobii T60XL眼动仪为工具,选用26名视力正常从事科研的江苏大学教师和研究生,记录其阅读专利文献的行为。实验中,将专利文献划分为12个要素即12个兴趣区,结合用户实验中的阅读行为、测前问卷、测后RTA访谈进行分析;构建访问时间、注视次数、瞳孔直径缩放比3指标,计算用户对各要素的兴趣度;构建各兴趣区回视次数的关系矩阵。根据用户在各个要素的兴趣度及不同要素间的兴趣关联程度,构建用户专利文献阅读的兴趣拓扑结构。(4)利用兴趣拓扑结构提供主动推送微服务模型。构建专利文献树形结构模型并进行文本预处理,利用兴趣度赋以兴趣特征词微兴趣权重、利用兴趣拓扑结构赋以特征词位置权重、结合特征词的长度对TF-IDF算法进行改进,计算特征词的综合权重,从而构建带有用户兴趣专利特征词向量空间模型;再挖掘利用兴趣特征词所对应的IPC小类,限定待检索的专利技术领域,在专利数据源中进行检索得检索结果;将用户兴趣的专利特征词向量与检索结果进行相似度匹配计算和排序,得用户TOP n兴趣专利文献。