论文部分内容阅读
本文结合Internet中文信息检索系统(WAIS)这样一个特定环境,探索了一种基于频率统计的中文自动标引方法.以往的自动标引方法所采用的词典匹配法有词典不完备等限制.而本文所介绍的方法则实现了不用任何词典,并进行了真正的全文献处理的自动词抽词标引,它突破了已有经验和知识的限制,能自动发现和学习新词,可以说它是一种具有自学习特点的智能型中文文献的自动标引方法.基于该方法的自由词主题标引系统已经实现.在Internet下被应用于采用WAIS工具进行中文信息的检索和查询,为在Internet上建立中文信息库和信息查询开辟了道路.