基于句子抽取的共词聚类分析结果表达方法的研究

来源 :中国医科大学 | 被引量 : 0次 | 上传用户:flysky1979
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:共词聚类分析结果的表达是共词分析应用的最后一步。现有的共词分析结果表达的方法均具有一定的局限性,所得到的结果存在主观性较强及表达不全面等问题。本研究提出基于句子抽取的共词聚类分析结果表达的方法,促进共词分析结果表达的客观性、准确性、易懂性和规范性,为研究者进行共词分析结果表达方面提供辅助和参考,进而在一定程度上促进信息分析技术在学科专业热点分析应用中的进一步发展。方法:本研究分两个层面获得主题词聚类结果,尝试对其进行结果表达:一篇是已发表的热点分析文章中共词分析的结果,另一篇是根据领域专家综述文章中的主题由研究者开展聚类分析后获得的共词分析结果,将这两个聚类结果作为研究样本。对于两类聚类结果,首先基于聚类结果中主题词的聚类顺序,根据一定的规则构建类内主题词组合,制定并执行对应的检索策略得到与每一个主题词组合相关的文献集;接着,通过自然语言处理技术,在文献集合的摘要中抽取所有主题词组合的语义关系表达,将抽取得到的两概念间的主要谓词及其代表句作为该词对所属类团的结果解读;最后,一方面将本研究得到的两个结果解读分别与相应进行共词分析的主题词数目对比,评价本方法对主题词的覆盖程度,另一方面将两结果分别与已有的共词分析结果和综述专题进行内容上的对比分析,最终对本方法的适用性做综合评价。结果:对于已发表的共词分析结果,本研究根据一定的主题词组合规则,将81个主题词构建为38个类内主题词组合,其中32个主题词组合可检索到相关文献集,17个主题词组合可以抽取到语义关系。通过本方法得到的共词分析结果表达对类内主题词的平均覆盖率为56%,17个类内主题词组合共得到了27种语义关系表达;将其与已发表论文中的结果表达对比发现,内容一致度为73%,且本文得到的结果解读更加具体,具有更好的可读性。对于根据选取的综述主题自行完成的共词分析,与研究主题密切相关的9个主题词形成了6个类内主题词组合,其中5个主题词组合可抽取语义关系。通过本文的方法得到的聚类结果表达对类内主题词的平均覆盖率达83%,5个类内主题词组合共得到8种语义关系表达;但将共词分析结果与综述原文中的内容对比发现,共词分析结果与综述内容存在一定程度的不一致。结论:研究结果表明,主题词聚类分析得到的热点在满足专家实践需求上还有待进一步研究;但本研究方法在常规的宏观的主题词聚类分析结果表达方面,能将类团内容较全面的表达出来,得到的类团内容解读具有一定的客观性、准确性和规范性,为进一步规范共词聚类结果的表达提供了有效途径。
其他文献
密集场景行人计数不仅具有理论研究价值,而且具有众多的应用前景,比如监控一个区域内的行人流量,统计地铁中的行人密度。密集场景行人计数拥有许多的难点。首先,在密集场景中,行人之间的遮挡非常的严重,行人的部分特征会丢失。其次,由于监控场景的摄像头分辨率一般不是很高,细节信息会丢失。第三,由于摄像头角度的问题,行人会发生变形。第四,在不同的监控场景中,背景,光线,以及行人的外观会有很大的不同。我们分析了当
传统结构可靠度的计算方法常常用在结构构件的可靠度分析上,当需要对结构整体进行可靠度分析或者对较复杂结构进行可靠度分析时,由于结构的功能函数难以显式表达,或极限状态
随着嵌入式设备的普及和Web技术的发展,移动Web应用也在迅速发展。为提升用户的浏览体验,移动Web应用的性能也在不断提升。而移动系统默认资源调度策略以最低响应延迟为目标,
近年来,建筑行业传统建造模式与生态文明建设要求之间的矛盾日益凸显,建筑行业转型升级迫在眉睫。而住宅产业化被公认为建筑行业实现绿色可持续发展的必然选择。但目前我国住
随着社会与科学技术的发展,摄影、拍照成为了人们记录生活的一种方式,并且人们开始追求各种各样的照片风格效果。20世纪90年代,图像的非真实感绘制技术进入了人们的视线。铅
作为未来5G关键技术之一,非正交多址能够满足无线蜂窝网络对于大规模机器类型连接的需求。NOMA通信技术主要通过功率域复用或稀疏编码来同时服务于多个用户,并在接收端采用连续干扰消除接收机进行信号的解调。本论文研究的是在单层网络多小区场景中,采用功率域NOMA进行上行传输的用户的平均系统能效问题。由于用户往往仅由其携带的电池供电,进行上行NOMA传输的用户通常是能量受限的。因此,本文考虑将射频能量收集
超流体支持无耗散运动是其超流动性的表现之一。超流体的临界速度vc是由其元激发能谱决定的,只要超流体中杂质的运动速度超过vc时,就会产生能量耗散。近年来,具有各向异性偶
目前,量子安全计算领域日益备受关注,量子隐私比较作为量子安全计算的重要分支也得到了深入研究。目前,在量子隐私相等关系比较协议中,大多数只能比较数字的相等关系,不能比
随着社会的发展与进步,人们的生活水平也不断提高,狗在人们日常生活中出现的频率也逐渐增加,越来越多的机构和组织也投入了对狗的研究与应用。其中狗脸图像的多目标检测具有
随着智能手机等移动电子设备的快速发展与普及,如今已进入全民摄影时代。由于摄影条件和摄影者自身美学鉴赏能力的差异,所拍摄图像的美学质量也呈现出较大的差异。为满足人们