论文部分内容阅读
本文介绍了一种新的基于c++模板技术实现的正则表达式引:Xpressive.并通过应用Xpressive技术中的静态正则表达式来实现网页清洗。该实现有效的避免了传统方法分析网页DOM树算法复杂不易实现的缺点.在保证算法简单和结果正确的同时,还以测试数据证明应用静态正则表达式运行速度上的优势。