HNC的字知识库

来源 :中国科学院 | 被引量 : 0次 | 上传用户:lwgalj2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字知识库是汉语理解处理不可缺少的资源,HNC的字知识库以描述汉字的动态组合知识为中心内容。HNC字知识库内首先定义了单用系数和组词系数来描述汉字的组合能力,然后具体描述汉字的组合知识。对汉字组合知识的描述有两个方面,一是跟什么样的概念或词语组合,二是组合之后的结果是什么。如果组合之后形成能充当特征语义块的词语,那么就要描述其句类和相应的句类知识。字知识库的建设需要跟词语知识库和小专家库的建设密切配合。
其他文献
壮汉双语专业学生承担着传承壮族文化的重任,但部分学生从读小学期,久离壮族文化环境,使其对壮族文化认同与自信不高。要解决这些问题,在人才培养上,要树立他们正确的国家观和民族观,将壮族文化课程设置于壮汉双语专业学生新生基础课程中;利用壮族的节日,开展丰富多彩的壮族文化活动;充分利用与非遗进校园活动,让壮汉双语专业学生充分了解壮族特有的民族文化;充分利用寒暑假指导学生进行社会实践周活动,让学生深入到各自
关于广西左江流域岩画的创作动机问题,历来不乏仁者见仁智者见智,也不乏真知灼见,但将其归结为一种简单、单纯的目的,如“游戏说”“祭祀说”“舞蹈说”“狩猎说”“镇妖说”“巫术说”“战争说”“语言符号说”等,未免有失公允,且只能作为最初的一种动机,或是最初一少部分人员的某种动机。随着数百年创作时间的不断向前推移,随着参与创作人数的不断增加,以及社会的进化、变迁、发展等因素,岩画的创作动机应是在原有基础上
睡虎地秦简文字处于古文字到今文字的过渡时期,字体兼有篆书和隶书的特点。字体风格上整体表现出平直化,体势有了横向趋势,章法结字灵活多变,笔划由圆转走向方折,同时伴随着线条的曝断、长短变化。逆入横出的笔势,粗细不匀的笔态,隶书波砾特征的隐现,这些都体现出睡虎地秦简字体风格的渐变性与过渡性。
由厦门大学邓晓华项目组承建的“客家·土楼数字博物馆”是中国数字科技馆的一部分,依托厦门大学人类学和客家研究的学科优势,充分利用数字化手段,突破地域障碍,展演物质遗产与非物质遗产,拉近公众与不可移动文化遗产对象的距离,满足当代人们对客家文化和土楼文化的向往。本文结合该馆的建设实践和社会评价,对客家文化与数字博物馆这一新兴形式的相互关系进行了探讨,并介绍了数字博物馆的相关概念,以及作为国家科普资源的共
本文旨在介绍台湾客语方言书面语语料库系统为一个基于后端架设的资料库及前端使用者介面所架构成的语料库平台,及建构此语料库之后设语言、介面功能。目前语料库收录约670篇文章,网页版介面已开放输入文本功能,近期内将完成网页版查询、批次修改及管理等功能,以提供研究者使用此线上语料库进行客语语意、句法、对比分析、应用教学等学术研究。
本文基于蒙古语语音合成语料库考察其语句内部的音高变化模式和韵律短语的切分线索问题.研究结果初步表明,在正常朗读条件下:(1)一个蒙古语句子在音调层面上通常可以切分成一个或多个相对独立完整的音高曲拱(pitch contour).一个音高曲拱一般有且仅有一个音高重音(pitch accent).在音高重音之前,音高通常会逐步上升,并在音高重音附近达到其峰值,然后逐步下降,并一直延续到音高曲拱的结束位
传统的译本比较研究只关注文本本身,有时也涉及译者问题,而对于文本和译者之外的译本文化生态环境极其跨文化交际功能的实现等问题关注较少。本文以清乾隆年间文人沈复的《浮生六记》的三个英译本为研究对象,对各译本中和原著对应的316个文化负载信息进行语料统计分析,归纳译者的翻译策略:之后对译者选择翻译或复译的原因进行分析,以说明译者在翻译过程中的策略选择;接着本文研究三个译本产生及存在的背景变量对译本及其实
在近代中国的历史上,《泰西新史揽要》经过李提摩太翻译后,由西方一部乏味的三流作品变成了中国最风行的读物。本文拟从读者批评的角度评析该译作的风行之原因和影响,说明是由晚清的历史现状和近代中国对西学的需求而引起举国上下全力争诵的局面。
本文以律师事务所外宣广告为例,通过自建小型语料库对英译文和相对于目的语文化语境下的可比文本进行了量化比较分析。结果显示,译文与可比文本在语篇信息性、视角、文体风格等方面体现出两者在信息功能与呼唤功能上存在某种程度的差异。通过对差异及原因的分析,本文目的在于探索一更加实用、有效的手段应用于应用型文本的翻译批评与实践。
本文通过对咳嗽声特性的分析,首先利用短时过零率和短时能量对咳嗽声进行端点初步检测,然后提取咳嗽的Mel频率倒谱系数作为特征参数,使用隐马尔可夫模型进行训练,建立咳嗽模板库。对所获得的234个样本进行训练和测试性识别,其中78个为训练样本,两组咳嗽测试样本和两组声音测试样本各为39个,识别系统把测试组咳嗽正确识别率为85.53%,把测试组声音错误识别为咳嗽的概率为7.89%。实验证明,通过将咳嗽声的