【摘 要】
:
其他网络商店的商品实时价格是Web商店店主所关注的重要数据,Web数据挖掘使得这一需求变为现实.通过正则表达式算法与分词算法的比较研究,给出了基于正则表达式的商品价格抽
【基金项目】
:
江苏省创新基金(BC2009 208), 淮安市产学研合作计划(HAC201002)
论文部分内容阅读
其他网络商店的商品实时价格是Web商店店主所关注的重要数据,Web数据挖掘使得这一需求变为现实.通过正则表达式算法与分词算法的比较研究,给出了基于正则表达式的商品价格抽取算法和基于分词的网站目录树抽取算法、HTML网页商品抽取算法与商品价格抽取算法.应用系统的实践表明,正则表达式算法的挖全率与正确率较低,而分词算法的挖全率与正确率都达到99%以上,完全满足应用需求,同时可以为商品的市场预测与分析提供依据.
其他文献
2010年9月8日,是王新宇和柳艳艳新婚大喜的日子。新□官王新宇的父母专程从外地老家赶来参加儿子的婚礼。可老两口做梦也想不到,儿子结婚庆典日竟成了儿子的出殡日,一场婚礼
首先对互连线模型进行了分析,介绍了插入缓冲器来减小长线延时的方法,然后通过具体计算分析了缓冲器插入的位置、数量,以及尺寸对连线延迟的影响,得出了理论上最理想的优化方
1 战后西方教育改革的起因 从二次大战后到60年代,在整个西方世界掀起的教育改革。从根本上说,主要是由于对教育有了新的要求,而传统的教育体制无法满足这些要求。 在战后美
提出了一种基于主动学习方法的网络流分类方法,采用主动学习技术提取少量高质量的训练样本进行建模.并提出了一种基于轮盘赌选择的样本筛选方法,能够有效避免已有主动学习方
云计算结构能极大地降低计算成本,但数据和计算的保密性和完整性目前还无法保证.设计了一种可信赖云计算平台(trust cloud computing platform,TCCP),可以为客户虚拟机安全执行
提出了一种基于查询事件的日志模型,采用查询/应答日志匹配的方法完整的记录了一次查询事件,利用内存数据结构提高了海量数据写入的I/O效率;在日志分析过程中对日志文件建立二维
在实时跟踪系统中,要求在跟踪过程中跟踪窗口的大小实时地适应运动目标的外观变化,这对应着Meanshift的尺度变化.针对跟踪这种尺度变化的问题,在跟踪框内检测角点并进行匹配,将所有得到的匹配角点对建立仿射模型,并采用最小二乘法求解得到尺度变化系数,进而更新跟踪框尺度,使得Meanshift算法可自适应地变化尺度并跟踪到大小不断变化的目标.实验结果表明,提出的算法具有较好的准确性、鲁棒性和实时性.