论文部分内容阅读
随着科技考古的广泛开展和不断深入,越来越多的考古数字资源产生出来,对考古研究与文物保护有着非常重要的价值。而数据挖掘技术作为大数据分析的利器,能够有效地应用于考古领域,从大量考古数据中发现隐藏的知识和规律,提高考古研究效率。因此,对考古数据资源的集成管理和挖掘分析具有重大意义和价值。本文针对考古数据分析中的两类常用需求:数据分类和相关性分析,以实际的考古研究工作为例,研究了数据挖掘方法在这两类问题中的应用。在考古数据分类方面,分别使用决策树和SVM分类方法,对良渚文化时期墓葬主人的社会等级进行分类预测。当前人工分类的方式需要具备考古学知识,且这些知识并不明显,不能以简单规则集合的形式表示出来。通过挖掘随葬器物数据中隐含的模式,我们可以实现自动而准确的分类。实验表明使用SVM分类模型,并引入领域知识选择重要器物用于分类,能够取得很好的效果。在考古数据相关性分析方面,提出基于FP-Growth算法的关联规则挖掘的框架。框架允许用户预先选择感兴趣的数据记录和数据项,有针对性地进行数据分析,避免无关数据的干扰:通过设置基于兴趣度的结果过滤指标,大大减少无趣项集和规则的数量,方便考古研究人员快速发现感兴趣的项集和规则。使用框架对良渚遗址的随葬器物数据进行相关性分析,验证了框架的有效性和实用性。最后本文对遗址发掘信息管理系统的设计和实现进行了介绍。系统实现了对大量多样的考古数据资源的集成管理,记录数据与资源文件的解耦存储和逻辑关联,以及资源文件的实时浏览,并针对上述两个考古研究问题,提供实用的考古数据挖掘分析功能。