论文部分内容阅读
比较购物是一个中介处理过程,它可以代替用户从不同的在线商店中查找需要的产品信息,并进行比较分析得出最佳价格.为了获得可扩展的智能化的比较购物,需要一个Agent来为每个半结构化的站点自动地建立一个简单的信息抽取过程-Wrapper.构建Wrapper过程是一个启发式的学习过程.文中算法的主要思想就是从HTML的查询结果页面中识别产品描述单元的位置,以及从一系列逻辑行中查找使用频率最高的模式来确定产品描述单元(PDU)的结构.