【摘 要】
:
针对专家库构建过程中出现的同名歧义现象,提出一种基于多特征融合的同名专家消歧方法。从中国知网(CNKI)数据源中获取专家的论文信息,抽取论文的标题、摘要、关键词、作者单
【机 构】
:
北京信息科技大学智能信息处理研究所,国家经济安全预警工程北京实验室,国家计算机网络与信息安全管理中心
【基金项目】
:
国家自然科学基金(61772081),促进高校内涵发展-研究生科技创新项目(5121911044)资助
论文部分内容阅读
针对专家库构建过程中出现的同名歧义现象,提出一种基于多特征融合的同名专家消歧方法。从中国知网(CNKI)数据源中获取专家的论文信息,抽取论文的标题、摘要、关键词、作者单位和合作者等关键信息,并将其作为属性特征,构建特征表示模型,进而定义同名专家之间的相似度计算函数。根据计算得到的相似度,将同名消歧问题转化为聚类问题。利用近邻传播聚类算法进行聚类,解决同名消歧问题。在采集的专家论文数据上的实验表明,基于多特征融合的同名专家消歧方法的准确率可达92%,取得良好的消歧效果。
其他文献
本文结合工程实例,根据某高层建筑的地质情况对基坑支护、基坑围护、基坑围护设计与施工等进行了分析。选择了最合适的施工方案。并对地下处理和施工也提出了措施。供同行参考
对西秦岭地区中川岩体、柏家庄岩体和教场坝花岗岩体进行LA-ICP-MS锆石U-Pb同位素年代学分析,获得其岩浆侵位年龄分别为220±1,216±6和222±3 Ma,表明3个岩体均
所谓爱学生,最基本的一点,要避免简单粗暴的教育态度。面对犯错误的孩子,不能用简单粗暴的方法去教育孩子,而要拥有一颗宽容的心。而只有保持情感的交流,心灵的对话,才能真正
"V+Q+O"结构是动宾离合词嵌入Q成分形成的离析结构。对该结构进行语义分析,并据此对动宾离合词进行分类,我们可以看出,述宾离合词形成该离析格式合格程度与其所带宾语有关,语
对塔里木盆地西缘下寒武统玉尔吐斯组3个典型的剖面开展岩石学及地球化学研究,探讨玉尔吐斯组沉积时期水体氧化‒还原环境及初级生产力,为玉尔吐斯组烃源岩分布及资源潜力评
基于shear stress transport(SST)k-ω湍流模型和Zwart空化模型,针对某一高比转数轴流泵模型,对叶片数分别为3、4和5的3组叶轮方案,分别进行了空化流场模拟和实验,计算了不同
建筑工程质量与安全管理是一个社会化企业化的问题,有效的施工项目管理对项目及企业都会带来良好经济效益,给国家也会带来良好的社会效益。本文结合本人多年工作实践,对建筑工程
目的:了解瑶族学生超声骨密度的变化规律及其影响因素,初步评估瑶族学生的骨量和营养状况,为儿童青少年骨代谢疾病的骨密度辅助诊断和筛查提供依据。方法:选取广西凌云县和巴
职业教育改革不但是俄罗斯教育改革的一项重要内容,而且具有鲜明的社会转型时期的特点。俄罗斯在继承前苏联职业教育传统的同时,大量而且大胆地借鉴了西方国家的若干做法,特
短肢剪力墙结构是介于框架一剪力墙结构和一般剪力墙结构之间的一种结构形式,其抗震薄弱环节是建筑平面外边缘及角点处的墙肢、“一字形”短肢剪力墙及连梁。