一种基于聚集系数的人名识别方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:hsmwdevil
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在中文文本分析的许多应用领域中,人名识别是一个广泛存在且受到持续关注的基本问题。虽然目前人名识别方法较多,但大多以语料统计和语言规则为基础。为此,针对事件文本中人名具有紧密联系的特征,基于聚集系数,提出一种新的人名识别方法。利用姓氏列表获得原始文本中的可能姓氏信息,基于人名语料信息所构建的统计模型和上下文新的信息提取出候选人名,定义人际语义相似性、人名可能度等量化方法,在此基础上设计一种基于人际网络聚集系数的人名过滤方法。实验结果表明,与现有基于隐马尔可夫模型的方法相比,该方法所获得的,l值有1.2%的提
其他文献
根据明渠水流流动型态的概念,通过对实验资料的分析,得到均匀流时糙率系数随水深增加而减小,形成M1型水面线的非均匀流时糙率系数随水深、水力坡度的增大而增大的规律.提出的
慢性阻塞性肺疾病(COPD)病理特征主要是炎症反应影响下的气道重构、肺实质变化及血管重塑,其中血管重塑是COPD的重要病理特征,可见在形成肺动脉高压及肺心病过程中的重要作用
<正>一、什么是良好的师生关系古今中外教育家都十分重视师生关系,并对良好的师生关系给予高度评价。所谓师生关系,顾名思义,就是指教师和学生之间的人际关系。从广义讲,师生
目的研究分析采用不同分娩方式的产后出血情况比较。方法选择剖宫产出血产妇30例作为对照组,再选择同期收治自然阴道分娩出血患者30例作为观察组。对比观察2组患者在产后出血
本文以具有代表性的澜沧江下段右支流沙河为例,并根据该流域内多站点实测水文气象资料分析云南境内横断山系纵向岭谷南延局部区域降雨、径流等特征量随高程、面积变化趋势。结
介绍了水量法插补未采样时刻含沙量的原理方法,以实测资料为准对比了各种插补方法的误差及精度,简化了日平均输沙率的计算,提高了工作效率.
现有的协同过滤算法未考虑用户浏览记录中用户对项目的潜在厌恶信息,忽视新老用户对不同流行度项目的兴趣差异。为此,提出一种改进的协同过滤算法。从用户浏览记录中提取用户
本文根据艾比湖流域各水文站历年水文统计资料及近几年来的实际水文调查,通过流域概况、气温、蒸发、降水、冰川、径流年内和年际变化、泥沙、冰情、水质等方面的分析,研究艾
本文基于互联网金融时代的背景下,一方面,一系列的金融创新产品涌现,尤其是网络融资使得传统银行业务大幅缩水,另一方面,小微企业的发展问题日益受到社会各界的重视,各个条线