分词系统计量研究与改进方案

来源 :第二届全国学生计算语言学研讨会 | 被引量 : 0次 | 上传用户:yatou5004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文利用中科院计算所ICTCLAS系统对《人民日报》1998年1月语料进行标注,并与北京大学免费发布的《人民日报》1998年1月标注语料进行比对分析,找出ICTCLAS系统存在的一些缺陷,提出进一步提高标注效果的方法.
其他文献
差压式流量计作为一种目前工业生产中用来测量气体、液体和蒸汽流量的常用流量仪表,在流量计量过程中发挥着越来越重要的作用。本文针对一种新型差压式流量传感器──V型内锥式流量传感器的特性展开对比实验,详细分析了影响V型内锥式流量传感器流出系数C的因素。
本文运用遗传算法来优化声全息测量系统中传感器阵列的布置。在声全息法重建声场理论的基础上,以遗传算法为优化手段,以确定传感器的最佳数目及最优位置为目标,建立了传感器阵列布置的优化模型。通过实验分析,该方法实际可行,有效地解决了原方法中靠经验摆放传感器的缺点,提高了声场重建的计算效率,降低了测量成本。
本文对基于LabVIEW和DSP的钢球外观视觉检测控制进行了研究。检测仪以TI公司的TMS320LF2407A芯片为核心,结合CPLD完成嵌入式系统步进电机控制。系统上位机采用LabVIEW实现图像处理、检测系统PID控制、与DSP之间的串口数据通信功能。其中,为实现对钢球位置与步进电机速度的精确控制,改进了基于虚拟仪器的PID采样控制,提出了新的PID算法。分别修正了比例、积分、微分作用,提高了
本文通过对电位器结构特点和噪声产生机理的分析,提出了基于频域分析的方法,实现对电位器动噪声信号的多参量的检测与分析。电位器动噪声信号检测分析系统采用嵌入式技术,采集电位器动噪声信号,完成下位机的控制和处理功能,上位机利用VC++实现分析检测等功能,弥补了传统电位器检测仪器的不足,为电位器的规模生产提供更可靠的材料分析依据和技术保证。
本文研究了三维地磁导航的算法,并把地磁导航与陀螺仪导航两种姿态测量方法进行了比较。在此基础上给出一种中低精度地磁导航系统的硬件设计方案,并介绍了系统所用磁阻传感器的使用方法及注意事项,提出了环境磁场的补偿算法,同时对姿态测量误差进行了估计。
本研究实现了利用MSP430低功耗单片机进行外围接口扩展,用TMS3205402DSP芯片进行数据采集,并通过HPI进行CPU间通信的双处理器的数据采集与处理系统。该系统能够进行多路数据采集和实时处理,能够通过液晶显示工作状态和处理结果,能够通过USB和串口与上位机通信进行数据交换,具有功能完善、性价比高、功耗低、易扩展等特点。
本文介绍了一款基于USB总线的高速数据采集系统,介绍了其硬件组成和软件设计。系统采用了Cypress公司的带有USB接口的EZ-USBFX2单片机系列芯片中的CY7C68013作为数据采集与控制芯片,具有比较简单的接口和控制方法。该系统已经通过专家评审和部队对接实验,下一步经过鉴定后就将交付部队使用。
汉语词典查询是中文信息处理系统的重要基础部分,对系统效率有重要的影响.本文对汉语词典查询算法研究作了简要回顾,设计实现了基于双数组TRIE机制的汉语词典查询算法,并提出了基于双编码机制的词典查询算法.最后对两种词典查询机制进行了实验分析.
在自然语言处理系统的应用过程中,很多系统允许用户自由挂接一部或多部领域词典,本文首先对采用二次分词方法产生的二次分词歧义现象的分布情况进行了研究,然后通过实验比较了两种挂接领域词典方法在分词中的不同及其对二次分词歧义的处理能力.
网上信息的爆炸式增长使信息抽取成为一个热点研究课题.传统的信息抽取系统通常需要专家手工书写模板.尽管目前模板获取的自动化程度有了大幅度的提高,人们仍然要手工标注大量的训练文本.本文提出了一种基于相似计算的纯文本信息抽取模板自动获取方法.根据给定的种子模板,从大规模的无标注的训练文本中可以自动学习相关的模板,生成的模板几乎不需人工处理就可以直接应用.与其他方法相比,本方法无需人工标注训练语料,节约了