【摘 要】
:
汉语词法分析是中文信息处理的基础,现阶段汉语词法分析的主流技术是基于统计的方法,这类方法的本质都是把词法分析过程看作序列数据标注问题.上下文是统计语言学中获取语言
【机 构】
:
安阳师范学院计算机与信息工程学院,河南安阳455002
论文部分内容阅读
汉语词法分析是中文信息处理的基础,现阶段汉语词法分析的主流技术是基于统计的方法,这类方法的本质都是把词法分析过程看作序列数据标注问题.上下文是统计语言学中获取语言知识和解决自然语言处理中多种实际应用问题必须依靠的资源和基础.汉语词法分析时需要从上下文获取相关的语言知识,但上文和下文是否同样重要。为克服仅凭主观经验给出猜测结果的不足,对汉语词法分析的分词、词性标注、命名实体识别这三项子任务进行了深入研究,对比了上文和下文对各个任务性能的影响,在国际汉语语言处理评测Bakeoff多种语料上进行了封闭测试,采用分别表征上文和下文的特征模板集进行了对比实验,结果表明,上文和下文对汉语分词和中文命名实体识别性能的影响差别较大,对汉语词性标注的性能影响差别较小.
其他文献
缩略语在自然语言中被大量应用,是未登录新词的一大“贡献者”,给自然语言处理带来了诸多困难。在汉语分词、词性标注、命名实体识别、机器翻译和信息检索等领域都受到了缩略语
中文信息处理中,中文分词作为一项基础工作,具有重要的意义。过去的十几年间,经过一系列研究探索,中文分词已取得长足的进步,准确性大为提升。中文分词是中文自然语言处理中最基本
南诏国是乌蛮贵族和白蛮大姓共同建立的一个奴隶制王国,始于公元649年,终于公元902年,传13代王,历时254年,几与唐朝相始终。它极盛时的疆域是“东西三千里,南北四千六百里”(
本文重点介绍了汇流器设计实现中运用的主要技术,例如接收信息格式及接收处理、编码及编码缓冲区的组织、通信控制器和系统瓶颈分析。针对提高价道利用率问题,本文还提出了一
从来没有一个国家的人,如我们这样,对一种交通工具有着如此固执的青睐。上到天子之乘,虽有金辇香车、名马玉辂,但向南边的花花世界指点一番后,他依然搭上了水殿龙舟,看花、赏
据史料记载,1931年1月1日由蒙古留日学生会主办的杂志《祖国》正式发行。但是由于史料欠缺有关《祖国》志诸多史实至今未得到翔实揭示。而在日本外务省外交文书中保存着一种
羌族是一个源远流长的古老民族,也是一个绚丽精彩的现代民族。它历史悠久,民风古朴,文化传承丰富多彩。细细品味它的演进密码,既可追寻中华民族孕育发祥的足迹,又可探究藏缅语族人群流离迁徙的踪影,还可聆听人类从远古走向未来妙曼而坚实的跫音。炎黄二部同生共荣,逐步形成中国远古文明的轴心;赫赫戎禹定鼎有夏,最终奠定华夏政治文明的基石。光辉灿烂的民族文化,让后人为这个永不衰老群落的顽强所敬佩、动容。 黄河中上
通过改变反应体系中的溶剂,以N,N-二甲基甲酰胺(DMF)为反应溶剂,在硒催化CO/H2O常压体系下,成功的合成了C酸.通过条件实验确定了最佳反应条件:原料硝基物1.5 g(3.0 mmol)、Se
[英]/De Laer C…//Am J Clin Nutr -1999,69(5).-968~972研究的目的旨在确定健康学龄儿童总高半胱氨酸(tHey)的分布,并探讨tHcy与叶酸、VitB12及与成年时心血管疾病的关系.对象与方法对象为1996年1?
[English] / De Laer C ... // Am J C
美观装饰是现代珠宝首饰的主导功能。珠宝首饰设计,一直受艺术思潮的影响。现代珠宝首饰设计的思想基础同现代艺术思潮相一致,从传统保守的观念中解脱出来,呈现出多元化趋势