论文部分内容阅读
提出一种基于WordNet的网页情境解析算法。获取网页集并建立基于DOM树网页解析;获取网页正文、网页生成时间和更新时间;对网页集进行基于WordNet的词性标注和词义消歧;利用命名实体识别技术获取网页正文内的时间和地点信息,作为网页的情境表示。经过实验对比,结果表明文中提出的方法和理论完全能够自动解析网页情境信息,为搜索提供巨大帮助。