论文部分内容阅读
数据挖掘技术是在近来信息化进程的发展和人们对信息需求的快速增加的大背景下应运而生的一项新技术。考古研究的进步使得找寻考古数据之间关系、并以此为途径研究其背后的社会和历史发展规律成为主题,将数据挖掘技术引入考古研究领域正好顺应了这一大趋势。决策树算法是典型的数据挖掘中的分类算法。为了适应考古研究的具体要求,我们基于C4.5算法,提出了两点改进:增加了一个表示研究背景的参数向量以改进决策树算法无法充分利用先验背景的确定;改变了分裂判定准则——信息增益率的计算方法以提高算法运行速度。经过检验二者都获得了较好的效