基于最大熵模型的共指消解研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:susan222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
共指是突发事件新闻报道中的常见现象。良好的处理共指现象,是进行信息提取的基本必要过程。本文采用最大熵模型对汉语突发事件新闻报道中的共指现象进行消解,目的是提取出突发事件新闻报道中指向同一实体的名词、代词和名词短语。根据问题特点。算法选择了8类特征作为模型的特征,该模型在20万字的新闻语料上进行训练,在10万字规模的语料上进行测试,最终的测试得到系统的F值为64.5%。
其他文献
目的研究乳腺癌组织中的c-erbB-2及突变型p53癌基因和ki-67抗原表达与乳癌临床特点及激素受体关系,揭示c-erbB-2、p53、ki-67表达对乳腺癌预后的评估意义.方法应用S-P免疫组
国内高血压病与心率变异性(HRV)的研究起始于二十世纪九十年代,通过记录高血压患者的动态心电图,然后应用计算机软件进行5分钟~24小时的长程心电信号的时域或频域分析,以探索
该文介绍基于声学统计建模的语音合成技术,重点回顾中国科学技术大学讯飞语音实验室在语音合成领域这一前沿发展方向的创新性工作成果。具体包括:融合发音动作参数与声学参数,
以ZnO,Cu(NO3)2和MnSO4等为原料制得ZnO负载铜锰双金属(CMZ)催化剂,并在H2O2/NaHCO3体系中氧化分解甲基橙(MO),通过XPS,AAS,UV-vis等方法分析了CMZ催化剂的组成,考察了反应条件对催
“自贸区”已经成为2013年中国最热门的词汇之一。  自7月国务院会议原则通过中国(上海)自由贸易试验区方案后,不断有媒体报出某某地正在调研建立自贸区的消息。梳理这些报道,可以发现,已有十几个省市在调研、准备方案,以期紧随上海之后摘得“自贸区”头衔。  《财经国家周刊》从一位接近商务部的人士处获悉,目前已经向商务部提交方案或进行了沟通的有:天津东疆,广东南沙、前海和横琴,浙江舟山,福建平潭,山东青
全球经济一体化、金融自由化和金融创新的发展,带来了世界范围内的金融混业经营。我国在分业经营的法律框架内实现了实质上的混业经营格局,这要求我国在金融监管体制模式选择上
词义消歧的关键问题是缺少大规模、高质量的词义标注语料库。本文分别从语料选取、词典选择、标注规模和标注质量等方面介绍已经建成的较有影响的若干词义标注语料库。在自动
目的 探讨泰素加卡铂联合治疗晚期非小细胞肺癌的疗效及毒性。方法 对33例应用泰素加卡铂治疗的晚期非小细胞肺癌患者进行分析。结果 泰素加卡铂的总有效率48.5%,其中鳞癌50%
2052年的中国,已经不再是传统意义上的民族国家了。它将是一个文化国家,是过去中国历朝历代的现代化身。古代中国曾经将自己视作文明的中心,而其他国家都是蛮夷之地。
动词次范畴是根据句法行为对动词的进一步划分,它是由核心动词和一系列论元组成。其相关研究在英汉等多种语言方面都取得了较好的成果,但跨语言之间的研究还很少。该文提出了一