论文部分内容阅读
<正> 在情报检索系统的软件设计中,使用杂凑表技术实行数据的快速存贮是屡见不鲜的。由于被存贮的对象——词或词组常常是不等长的,在分配给每个词或词组的计算机内部存贮空间时,若以词典中最长的词为分配标准,便会造成存贮空间的极大浪费。针对这种情况,设计者们提出了不等长词的不等长存贮处理方法,即把词典根据词长的分布情况划分成几个不等存贮词长的子词典,按不同情况分别加以处理,以节省存贮空间。在一定条件下,子词典的个数愈多,节省空间的效果愈明显。但是,子词典的数目