论文部分内容阅读
Web是动态性极强的信息源,访问、分析信息必须研究异构数据的集成问题,并选择合适的技术进行数据分析、集成和处理。怎样对Web海量的数据信息进行深层次的应用已成为数据挖掘技术的研究热点。本文介绍了XML(可扩展标记语言)在Web数据挖掘中的应用,探讨了Web数据挖掘中的数据异构问题。通过XML技术建立数据抽取模型,解决互联网上绝大多数因异构、非结构化所导致的Web数据挖掘问题。