论文部分内容阅读
对用户信息需求自动处理方法的研究是信息系统研究领域的重点之一,其中信息过滤系统的目标就是能够快速准确的从海量文本信息中挖掘出符合用户定制或者查询需求的信息。针对目前文本信息特征向量维数太高并且语义重复性较大的缺点,给出一种对信息过滤系统实现的语义扩展模型,其主要方法是在系统中选取适当规模的概念集合,利用其代替关键词集合来计算得到系统中文本信息的特征向量,通过计算实现文本信息的聚类,然后基于系统的语义关联信息将各个聚类实现基于分层P2P架构的组织。试验证明,文中的语义扩展模型有效实现海量动态信息数据的高效组