中文文本兼类词的标注技术

来源 :1998中文信息处理国际会议 | 被引量 : 0次 | 上传用户:llccxx1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语料库词性自动标注是语言信息处理中的基础课题。实践表明,造成汉语的词性标注准确率不高、难以实用化的最重要的因素是软件的兼类词鉴别能力差。作者以大规模的真实中文文本中反映的语言事实力依据,采用概率统计和基于规则相结合的混合方法,对汉语的语料进行了标注试验,取得了较为满意的效果。
其他文献
该文分析报网络专家系统开发工具JESS[1]的历史,特点,基本功能和当前发展,并对大量专家系统开发工具进行了比较分析。
由于对多类问题的高维数据无法直接观察其聚类和分布特性,该文采用神经网络法实现自适应主元特征提取(APEX)、以压缩特征空间的维数,并保持足够的信息来鉴别事物之间的类别,它可有效地提取信号的主要特征、抑制噪声。研究人员将高维数据压缩影射到2或3维,从而实现特征数据的可视性分析,显示物体对象间的类似程度和关系结构,并采用高阶果表明高阶函数神经网络较BP网络分类能力强,训练速度快。
在人脑皮层的下颞叶区存在着规整的功能柱型结构群,它们对中等复杂的特征具有选择性响应,为模式识别的特征检测学说提供了一个有力的证据,并由于它们毗邻构成一个连续的特征空间,为知觉不变性找到了生理解释。该文从物体视觉识别的神经生理学角度,构造一个近似于视皮层功能柱型结构的软件组件来对物体特征进行抽提,在由简单特征构成的特征空间基础上进行相对复杂特征的连续变换的不变性映射。通过构造一个金字塔状的神经网络层
该文介绍了线阵SSPA的工作原理以及使用线阵SSPA作为光电传感器的机器视觉检测系统的组成和检测原理。以人民币纸币的动态检测系统为例,着重讨论了SSPA的驱动、视频信号的处理和二值化以及数字信号的采集和处理方法,分析了系统的检测精度。
CO〈,2〉气体保护焊是目前使用最广泛的焊接方法之一,该文简要分析了CO〈,2〉体气保护焊飞溅产生的原因,并根据飞溅形成机理综述了减少飞溅的主要措施。
阐述了如何根据响函数,从线性映射的角度来创建状态空间数学模型的理论。
在推理控制系统的输入输出模型(II/O模型)基础上,提出了最小方差推理控制器设计方法,进而给出II/O模型的参数辨识算法以及相应的直接自尖控制算法。并对整个算法给出了全局收敛的条件。它的显著特点是把推理估计和推理控制器的设计有机地结合起来,简化了设计过程,也减少了计算量。同时,信真结果说明了该算法的收敛性和有效性,它适用于稳定系统的最小相位系统。
着重考虑系统矩阵和输入矩阵具有时变范数有界的不确定性的线性不确定系统,阐明了如下的鲁棒H〈,∞〉控制问题:设计线性动态输入反馈使对所有容 许的参数不确定的闭环系统二次稳定且达到所给定的干扰衰减程度,并且表明了这样的问题等价于一个H〈,∞〉控制问题。
探讨用于大型构件振动时效处理的新型系统。介绍了由效流电机和变频控制器组成的低频大激振力的激振器。采用微型计算机及外围设备构成的新型振动时效智能测控系统。