基于k-近似的汉语词类自动判定

来源 :计算机学报 | 被引量 : 26次 | 上传用户:hz9466894
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生词处理在面向大规模真实文本的自然语言处理各项应用中占有重要位置 .词类自动判定就是对词类未知的生词由机器自动赋予一个合适的词类标记 .文中提出了一种基于 k-近似的词类自动判定算法 ,并在一个 1亿字汉语语料库及一个 6 0万字经过人工分词和词类标注的汉语熟语料库的支持下 ,构造了相应实验 .实验结果初步显示 ,本算法对汉语开放词类——名词、动词、形容词的词类自动判定平均正确率分别为 99.2 1%、84.73%、70 .6 7% ,基本上能够满足工程实现的需要
其他文献
倡导师生之间,学生之间互动探究是新的小学语文新课标的一大亮点。互动探究能有效地促进师生之间互相促进,共同提高,培养学生的合作精神。本文对此进行了阐述。
诗是语言的艺术,要读懂一首诗,必先理解诗的语言含义。诗词的语言要求精练、含蓄,同时诗词的语言又具有跳跃性。本文拟就此谈谈自己的一点看法。
英语是一门语言交际工具,培养学生的口语能力,是英语教学的首要任务。本文论述了培养学生口语交际能力的方法。
随着新课程改革的深入,任务型教学日益引起高中英语教学的广泛关注,并在实践中取得了良好的效果。本文阐述了任务教学运作的运作模式与特点。
陕县庙上村天井窑院度假村是陕县地区目前唯一开发的旅游景区,本文就庙上村天井窑院度假村的开发现状、存在问题进行了探讨,并提出了相应的对策。
本文介绍了汽车检测与维修技术专业“技能三段式”人才培养模式培养过程中各阶段技能等级标准的内涵、培养手段及观测点,并详细介绍各阶段技能等级标准及其意义。
本文介绍了城市规划设计的特性,对城市规划设计的要素进行了研究。
在利用实测的结构动态特性修正结构分析模型中 ,针对实测低阶固有频率 ,固有振型含有测量误差 ,造成结构特征方程不适定性的问题 ,以及实测振型的坐标数比分析模型指定的坐标
提出并构造了一种新的人工生命意义下的创发性 (2 +2 +n )模型 ,同前人的工作相比 ,该模型的突出特点在于 :将 2维形状纳入创发性分析过程并使模型拓展至多维结构形式 ,描述
在分析传统手写汉字文本切分算法利弊的基础上 ,提出了一种改进的基于快速连通域提取的切分算法,算法具有很强的抗干扰能力,有效解决了小角度歪斜图像和笔画粘连字符的汉字切