论文部分内容阅读
向量空间模型是以特征项权重为核心的算法,特征项权重对文本分类、检索等的效果起着至关重要的作用。文中提出了一个新的权重概念——领域权重,并利用它改进传统向量空间模型。改进后的模型综合考虑原有特征项权重和文档中特征项自身的领域权重。在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率和F测试值。