论文部分内容阅读
在数据集成应用中,增量检测一个最主要的职责就是检测计算出数据源的增量数据,有多种方式可以检测分析出数据源的变化数据:触发器、日志分析、快照差分等等。而快照差分又可以采用不同的算法对两个快照进行计算,针对差分算法中SortMerge算法的一个改进和实现,主要利用有序文件来提高增量计算的效率。由于快照差分在字符串比对、文件差异计算、大数据量的差异对比、自然连接等实际问题有应用,对此类问题都有一定借鉴意义。