【摘 要】
:
模式匹配是信息抽取系统通常使用的方法,如何生成信息抽取模式就成为信息抽取的关键问题.由于手工编写模式的代价太大,本文尝试采用聚类方法自动生成针对中文文本的信息抽取
【基金项目】
:
国家高技术研究发展计划(863计划)
论文部分内容阅读
模式匹配是信息抽取系统通常使用的方法,如何生成信息抽取模式就成为信息抽取的关键问题.由于手工编写模式的代价太大,本文尝试采用聚类方法自动生成针对中文文本的信息抽取模式.通过计算模式实例间的相似度,采用单链法聚类,将模式实例划分为不同的类别,每个类别对应一个模式,将同一类别中的模式实例进行合并就可以得到最终的信息抽取模式.以农作物信息文本为实验语料,进行了聚类测试,错分率与漏分率分别为0.21%和1.07%,合并后的模式覆盖了人工分析提出的25类中的24类.
其他文献
第二届全国旋律学学术研讨会于6月8日至14日在香港大学隆重举行。云南丽江地区文化局的余崇先和云南艺术学院的李薇应邀出席了此次盛会,并在会上分别宣讲了研究纳西民歌旋律
关注名流大家的思想成就,分享业外名企的典型案例,传递最具价值的商业新知,成就商务精英的辉煌事业。2007《财智》,关注财富,更关注成功。因为经验可以推广,学习可以提高,成功可以复
与时下风靡的奢侈风格截然相反,成都什邡红时尚美容SPA偏偏走的是简约极致的风格路线。听起来是个很大胆的想法。不管是墙壁上还是门上,甚至是玻璃上,都彰显着他们的标志——
1995年我国石油天然气在一次能源结构中分别占17.3%及1.8%,对国民经济和社会发展起着重要作用。研究石油天然气增长方式,主要是从矿业经济的角度,预测石油天然气产量的增长,
2009年是全球经济大震动的一年,是危险和机遇并存的一年。作为以满足内需为主的美容行业,在这次金融震荡中凭借良好的资金回流链,并未受太大冲击。但受整体负面信息的影响,消费者
10月黄金周又是举家出游的好日子,不过,由于近期H1N1横行、机票价格又居高不下,为旅行蒙上了一层阴影。这个时候不妨让身体来一次旅行吧,选择一个舒服、放松、豁然开朗的SPA目的
<正> 由中国音乐家协会、福建省文联和厦门市文联共同主办的“钟鸣盛世——献给党的第十六次全国代表大会”音乐会于11月5日、6日在北京中山公园音乐堂隆重举行。 音乐会上,
(河北省唐山市王官营镇中学) 兴趣是最好的老师。学生只有对所学科目感兴趣,才能把兴趣转化为学习动力,把“要我学”变为“我要学”。激发学生学习的兴趣,帮助他们建立学习的成就感和自信心,增强他们在学习过程中综合运用语言的能力。 学习兴趣学习能力自信浓厚的学习兴趣是学生努力学习的动力、学好英语的前提,它能有效地诱发学习动机,使學生自觉地投入到学习中去。在教学中为了激发学生学习英语的兴趣,把英语学好。
本文提出了一种中文自动文摘的方法.不同于其它的基于词频统计的一般方法,运用概念(词义)作为特征取代词语.用概念统计代替传统的词形频率统计方法,建立概念向量空间模型,计