【摘 要】
:
指代消解是自然语言处理领域中的一个重要问题。本文引入图对汉语名词短语的指代消解问题进行建模,将指代消解问题转化为图划分问题,并应用关联聚类算法来实现对图的自动划分
【机 构】
:
南京大学计算机软件新技术国家重点实验室,南京大学计算机科学与技术系
【基金项目】
:
国家自然科学基金项目(60673043)、国家863高技术研究发展计划(2006AA012143、2006AA012139).
论文部分内容阅读
指代消解是自然语言处理领域中的一个重要问题。本文引入图对汉语名词短语的指代消解问题进行建模,将指代消解问题转化为图划分问题,并应用关联聚类算法来实现对图的自动划分。相对于传统的link-first和link-best聚类机制,该方法并不是孤立地针对每一对名词短语分别进行共指决策,而是充分考虑了多个名词短语之间的相关性,且不需事先给出聚类的数量以及距离阈值。通过在ACE中文语料上名词短语消解的实验结果表明,该方法是一个有效的指代消解算法。
其他文献
基于多期复合期权理论,建立了可转换公司债券定价的控制方程,依据可转债的特征提出了相应的边界条件和终端条件,并采用有限差分方法进行了数值模拟,从而克服了复合期权模型中
开发算法程序是计算机科学领域中最具挑战性的问题之一。为了提高算法程序的可靠性和生产效率,人们正在追求其开发的自动化。算法程序变换是实现算法程序开发自动化的重要途径
针对多目标运输问题往往存在各目标间协调性差或冲突发生的现象,提出一种求解多目标运输问题的目标协调优化方法。以各目标做出一定的让步为切入点,通过寻求最小让步对各个目标
通过一个理性预期均衡模型,证明信息披露与均衡价格期望正相关,并量化确定交易者间信息不对称导致的信息风险贴水,从宏观角度论证了信息披露有助于降低IPO折价。证明信息披露与
机动时间特性研究是对项目进度进行科学管理的基础。为了分析路线机动时间和关键路线法(CPM)网络机动时间特性,本文利用几类机动时间概念,特别是总时差,前、后共用时差,双单和双共
文章提出了一种基于高集成化的直接数字频率合成技术构成的程控信号发生器的设计方案,用于模拟微硬盘读写通道的伺服信号,方案采用超大规模FPGA(field-programmable logic)集成PD
在BA模型中引入技术相似程度这一变量,分析无标度网络的形成过程及其结构特点对FDI技术溢出效应的影响。仿真结果表明,新模型生成的网络具有无标度性。当节点之间的相对于外商
本文利用自组织拓扑映射方法设计了一种简易主曲线学习的算法,该算法继承了HS主曲线算法和K主曲线算法的主要优点,同时降低了一般主曲线算法的难度,使其变得更简洁明了.
流媒体服务是Internet上一类高带宽需求和高实时性约束的应用,对服务质量(Quality of Service,QoS)有较高的要求。流媒体服务的发展导致传统的QoS管理框架难以适应平台的异构性和
以学生为中心的个性化、交互协作式教学是远程教学的本质特征。在分析远程教育的现状基础上,论文提出了基于多代理技术的个性化远程教育系统。该系统集www技术和Agent技术与一