论文部分内容阅读
设计一个文本过滤实验,首先从语料库的词频统计结果中挖掘出词频的二元关联度,然后用一个Hopfield网络将词频的二元关联关系转化为语境关联关系,训练语言单位在整个上下文环境下的权重,并建立用户模板.该算法改善了词频特征提取算法与文本上下文环境的匹配状况,实验结果表明,对专业性Web文档的过滤可达到更高的精确度.