共现关键词一叙词同义关系自动识别研究——基于互信息法、概率法的对比分析

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:JK0803_shijiwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以科技文献中的共现关键词一叙词词对(以下简称共现词对)为研究对象,运用互信息法、概率法计算方法,以准确率和召回率为衡量指标,通过绝对值方式和相对最高值方式,分析这两种统计方法在不同区间内对同义共现词对的自动识别效果及特点。研究发现,概率法的相对最高值方式具有最佳的同义共现词对识别效果。最后,探讨互信息法、概率法与共现频率的关系,揭示这两种统计方法在同义共现词对的识别上存在互补的特性。
其他文献
从用户需求的角度出发,考量科技信息资源的自身特点,在文献研究、要素分析和专家访谈的基础上设计评价量表。经量表预试与项目分析,根据统计数据与专家商议结果对量表进行修
为考察专利情报和学术论文中的合作现象的发展历程、影响因素及未来方向,采用专利计量学与文献计量学方法,对专利情报和学术论文中合作情况进行时间趋势分析,并对两者进行对
指出微博信息生态链的构成要素包括信息内容、信息人和传播路径。认为信息人分为信息生产者、信息传播者、信息组织者、信息消费者和信息分解者。信息人角色在微博信息生态链
以农村信息资源作为研究对象,以数据包络分析(DEA)为方法,从投入和产出的角度对农村信息资源配置的效率进行评价。首先借鉴现有的信息化指标体系设计出DEA指标体系,然后利用主成分
对专利组合理论进行介绍,构建基于技术生命周期的专利组合判别模型,并以抗HBV制药企业为实证研究对象,利用Logistic模型生成S曲线进行技术生命周期判断。在此基础上,绘制技术生命
《永昌府文征》是20世纪40年代初,云南省腾冲藉辛亥革命元老,杰出的政治家、军事家、教育家和文史学家李根源先生为光大民族文化之精华,聚众多学者之力编纂而成的一部永昌地方文
指出了由于SSD(Hard Disk Driver,HDD)的不对称I/O特性和价格因素,在分布式系统Hadoop中,由SSD和HDD组成混合存储系统是一种有效的解决方案.HDFS是针对同构集群设计的,对存储
针对美国和加拿大等高校共同承担的大型跨学科人文文本挖掘项目MONK,详细介绍其文本挖掘流程及相应的工具、技术和算法,并具体探讨利用MONK提供的工具进行文学文本挖掘研究的应
白族是我国具有悠久历史文化的少数民族,现主要集居于云南省大理白族自治州。早在4000多年前,白族先民就在这里生活,创造了光辉灿烂的白族文化。源远流长的白族文化是在白族人民
基于清华汉语树库,利用条件随机场,构建时间表达式知识抽取模型。为了确保模型的性能,统计分析时间表达式的内部和外部特征,并把确定的特征应用到模型的构建中。在语言特征模板基