论文部分内容阅读
提出一种Web信息抽取规则的优化方法,用于提高信息抽取的效率,采用分级制的思想,将原有规则中的限制条件分为粗规则和细规则两部分,粗规则面向网页中所有的信息片断,用于信息的初步过滤;细规则面向过滤后的信息片断,用于抽取最终的信息,由此,避免了将规则中的限制条件应用于网页中的所有信息片断,达到了减少计算量、提高抽取速度的目的。