论文部分内容阅读
在考古研究特别是科技考古领域中,使用统计图表的形式呈现数据并分析结论这一研究方式近年来得到广泛运用。近五年考古学核心期刊发表的相关论文中,SPSS、R语言、Origin、Systat是较常用的统计分析软件,其中SPSS占绝对比重。SPSS英文全称“Statistical Product and Service Solutions”,中文名为“统计产品和服务解决方案”,它是世界上最早发明的一款数据统计分析软件,运算结果可靠,国际认可度较高。相较其他几款统计分析软件,SPSS以各类功能模块和菜单命令为主要操作方式,复杂运算无须单独编辑语法命令,简单易学,非统计专业人员也较容易掌握操作要领。
瓦件是古代城市遗址中的常见建筑构件,以往发掘简报和报告中,披露瓦件尺寸数据是普遍做法,但进一步研究数据所反映的深层次问题往往浅尝辄止。这里使用SPSS 24.0版本,简要介绍SPSS数据管理和绘图的操作流程,初步探讨SPSS在瓦件研究领域中的作用。这里选取秦都咸阳城、西汉长安城和汉魏洛阳城发表的瓦件数据进行分析,这几座城址时空范围不同,选用不同图形输出方式以分析不同城址瓦件材料,一方面可以让使用者依据材料的特点更有针对性地选取图形输出方式,另一方面可以结合材料特点更全面展示SPSS的各项绘图功能以及可以实现的目的。
SPSS绘图类型和输出方式
SPSS绘图与传统考古绘图存在根本区别,它并不针对遗迹、遗物自身形态绘图,而是对采集的遗迹和遗物数据进行统计分析,以问题为导向输出条形图、折线图、面积图、饼图、散点图、箱图等多种图形。以秦都咸阳城一号宫殿瓦当数据为例,在“图形”菜单中,“图表构建器”“图形画板模板选择器”“旧对话框”是三种常用的图形输出方式。
图表构建器
“图表构建器”是一种交互式图形生成器,由“变量框”“图表预览使用示例数据框”“图库”等相关单元框组成。图库提供多种图形,每种图形根据选取变量的不同又分为多种类型。若绘制某一图形,只需在图库中双击或将图库中某一图形直接拖入“图表预览使用示例数据框”即可。例如选用箱图,若要呈现秦都咸阳城一号宫殿不同类型瓦当直径数据分布情况,可将变量框中“类型”拖入X轴,将所要分析的瓦当直径变量拖入Y轴。有时会选取多组变量进行综合分析,可以在“组/点ID”选项卡中勾选聚类变量,然后在变量框中进行选择。标题和脚注也可根据具体需要进行设置,设置完成后点击“确定”,此时数据运算过程会在独立的“查看器”中显示。
图形画板模板选择器
“图形画板模板选择器”是一种更加智能的交互式可视化图形生成工具,根据选取的变量组合,系统自动生成符合数据运算逻辑的图形预览,供使用者选择。这种图形输出方式一方面直观高效地对数据变量进行统计,提供多种图形选择;另一方面规定了数据在科学运算下输出的几种理想方案,一定程度上减少了手动选择可能出现的纰漏。
选择“图形画板模板选择器”,在界面中选择秦都咸阳城一号宫殿瓦当数据中的“类型”“当面径”变量,右侧预览区域自动显示由这两个变量可生成的各类图形,根据需求进行选择,同时在“详细”“标题”“选项”等选项卡中对将要生成的图形进一步设置。
旧对话框
“旧对话框”中的几类图形实际是“图表构建器”中所有图形种类的精简版,除界面显示略有不同外,操作理念基本相同。以簇状条形图为例,在“旧对话框”中选择“条形图”,勾选“簇状”“个案组摘要”,点击“定义”进入“定义簇状条形图”界面。在此界面中,将左侧“当面径”变量拖入右侧“变量”框中,SPSS提供多种统计方式,包括“个案数”“个案百分比”“累计个案数”等,此处需要统计每一瓦当个案中的直径数值,所以勾选“其他统计”,默认“值的平均值”。如果不需要统计原始数据,“更改统计”菜单还提供了“标准差”“值的中位数”“方差”等多种选择。设置完变量后,需要将左侧类型变量拖入右侧“类别轴”,这是图形中X轴的分类依据。在数据库中,每一瓦当个案均附有“型式”信息,如果还需要进一步以型式进行分组,可以将左侧“型式”变量拖入右侧“聚类定义依据”中。以上所有设置完成后,点击“确定”,在“查看器”中输出图形。除条形图外,其他种类图形设置均与此类同。
单一数据变量的图形输出
单一数据变量的图形输出是较为常用的方式,它是对前文提及的三种图形输出方式更具体、更综合的应用。SPSS可以呈现瓦件某一数据变量在不同地点的总体分布特征,也可以呈现各地点各类瓦件某一数据变量的分布特征。依据单一数据变量是否分组,可分为变量无分组图形输出和变量分组图形输出。
单一数据变量无分组图形输出
单一数据变量无分组图形输出可有效对多个出土地点同一类器物数据进行观察。西汉长安城出土瓦当的地点多、数量丰富,是考察单一数据变量的较好案例。根据以往研究成果,可大致将各遗址瓦当时代划分为西汉早期至中期和西汉中期至晚期两大阶段。以西汉早期至中期各遗址瓦当直径数据为例进行分析,箱图是较为适合的呈现方式。箱图可观察数据的分布范围、平均数、中位数、二分位数、四分位数、最大值、最小值、异常值、极值等。在数据编辑器中建立西汉早期至中期瓦当数据或打开提前保存好的瓦当数据文件,之后在“图表构建器”中选择箱图,将“遗址”变量拖入X轴,将“直径”变量拖入Y轴,点击“确定”,在“查看器”中输出图形,可得到各遗址瓦当直径原始箱图。箱图显示,未央宫椒房殿遗址瓦当直径出现异常值,编号为32的瓦当,直径21cm,超出了IQR(四分位距)的1.5倍,说明在箱图较为集中的区域范围内,此瓦当直径偏大。阳陵陵园南门遗址同时出现了极值和异常值,编号57(直径15cm)和61(直径20.8cm)显示为极值;编号59(直径15.5cm)、60(直径15.5cm)和67(直径18.8cm)显示为异常值。异常值和极值的存在反映了阳陵陵园南门瓦当直径差异大。与未央宫和武库瓦当直径分布態势相比,阳陵陵园南门瓦当直径整体偏大,这一现象为讨论阳陵陵园门阙的等级问题提供了新视角。
单一数据变量分组图形输出
单一数据变量分组图形输出往往因为瓦件存在更详细的分类而得到更丰富的数据信息,箱图亦是较好的选择。以西汉长安城中期至晚期各遗址瓦当直径数据为例,使用“图形画板模板选择器”,同时选中“遗址”“纹饰”“直径”,在图形预览中选择“聚类箱图”,点击“确定”即可输出聚类箱图。聚类箱图首先根据不同遗址分类,在此基础上再根据各遗址不同类型瓦当进一步区分,形成双重分类依据。箱图显示,与云纹瓦当相比,多数遗址的文字瓦当中位数数值更高,箱形区域更集中,显示出文字瓦当规格的特殊性,这为探讨文字瓦当的使用等级提供了更为直观的线索。
数据变量的标准化处理与图形输出
瓦件的标准化研究是较为新颖的研究视角,田亚岐、腾铭予、蔡彦、马欢欢等学者运用Systat对瓦件的标准化研究为我们提供了一种新思路。此视角可以观察同一时代不同遗址或同一遗址不同时代瓦件整体和个体之间的标准化程度,进而探究工匠熟练程度、工匠流动以及手工业管理制度等问题。
与Systat统计分析方式相比,SPSS统计分析更高效、便捷。汉魏洛阳城历时性长,出土瓦件种类丰富,阶段性演变特征明显,是进行瓦件标准化分析的较好案例。汉魏洛阳城出土的各类瓦件大致分属汉晋、魏晋十六国和北魏三个时期,汉晋时期主要流行绳纹面布纹里板瓦、绳纹面布纹里筒瓦、云纹瓦当、文字瓦当;魏晋十六国时期主要流行篮纹板瓦、部分素面筒瓦、三角缘云纹瓦当;北魏时期主要流行磨光面板瓦、磨光面筒瓦、部分素面筒瓦、莲花纹瓦当、兽面纹瓦当、忍冬纹瓦当等。其中,流行于魏晋十六国时期的瓦件个体数量较少,尚难进行数据统计,本文选取数量较多的汉晋和北魏时期瓦件进行统计分析。汉晋时期板瓦67件,筒瓦65件,瓦当61件;北魏时期板瓦22件,筒瓦20件,瓦当32件。统计变量包括板瓦厚度、筒瓦厚度、瓦当厚度、瓦当边轮宽度。
在统计分析前首先要对四个变量数据进行标准化处理,SPSS默认的标准化处理方式为Z-score处理方式,公式为标准化值=(变量值-平均值)÷标准差。在SPSS中导入汉魏洛阳城汉晋和北魏时期板瓦厚度数据,在菜单栏中选择“分析”菜单,选择“描述统计”中的“描述”菜单,在描述界面,将板瓦“厚度”变量拖入变量框中,并勾选“将标准化值另存为变量”,以方便对标准化值进一步分析。同样的,将筒瓦和瓦当相关变量按照同样的方法进行标准化处理。然后使用SPSS制作板瓦厚度、筒瓦厚度、瓦当厚度、瓦当边轮宽度标准值的箱图。
箱图显示,尽管汉魏洛阳城汉晋时期板瓦和筒瓦厚度标准化值比北魏时期更为集中,但极值和异常值过多,说明汉晋时期工匠整体受到的制瓦规范约束性更弱。汉魏洛阳城北魏时期瓦当边轮宽度标准化值比汉晋时期更为集中,但两时期均存在异常值和极值现象,这反映出北魏时期瓦当边轮宽度标准化程度应当更高。北魏时期瓦当厚度的标准化值同样比汉晋时期更为集中,说明北魏时期瓦当厚度标准化程度比汉晋时期高。因此,汉魏洛阳城北魏时期瓦件整体标准化程度应高于汉晋时期,工匠受到更严格的约束和管理。与汉晋时期相比,洛阳城出土的北魏时期各类瓦件差异较大,汉晋时期流行的绳纹板瓦、绳纹筒瓦、云纹瓦当在北魏时期基本消失,代之以磨光面板瓦、素面筒瓦、磨光面筒瓦、兽面纹瓦当、莲花纹瓦当和忍冬纹瓦当等,其中多数种类瓦件与汉晋时期相比更为厚重,烧制质量高,规格较大,多磨光,尚黑色,宫城核心区域出土的瓦件特征更为明显。北魏迁都洛阳之初,孝文帝便在洛阳进行大规模营建工程,作为入主中原的少数民族政权,北魏以洛阳为都时期并没有完全沿用中原地区汉晋时期瓦件,而是沿用平城时期创制的瓦件。此时期瓦件制作工藝水平达到前所未有的高度,瓦件数据一定程度上反映出工匠生产管理体系乃至匠作制度应比汉晋时期更严格,也在一定程度上反映出北魏统治者改革创新的雄心。
以上案例表明,与瓦件传统研究相比,使用SPSS对瓦件数据进行分析具有两个明显优势:第一,SPSS可高效处理数量庞大的瓦件数据,通过绘制不同图形,将数据用更加立体、直观的方式呈现,从而发现新问题,得到新认识;第二,SPSS的运用可使瓦件制作工艺研究从宏观走向微观,为探究匠作制度提供一种工具和思路。
感谢南京大学优秀博士研究生创新能力提升计划B(202002B070)对本文的支持。
(作者为南京大学历史学院博士研究生)
瓦件是古代城市遗址中的常见建筑构件,以往发掘简报和报告中,披露瓦件尺寸数据是普遍做法,但进一步研究数据所反映的深层次问题往往浅尝辄止。这里使用SPSS 24.0版本,简要介绍SPSS数据管理和绘图的操作流程,初步探讨SPSS在瓦件研究领域中的作用。这里选取秦都咸阳城、西汉长安城和汉魏洛阳城发表的瓦件数据进行分析,这几座城址时空范围不同,选用不同图形输出方式以分析不同城址瓦件材料,一方面可以让使用者依据材料的特点更有针对性地选取图形输出方式,另一方面可以结合材料特点更全面展示SPSS的各项绘图功能以及可以实现的目的。
SPSS绘图类型和输出方式
SPSS绘图与传统考古绘图存在根本区别,它并不针对遗迹、遗物自身形态绘图,而是对采集的遗迹和遗物数据进行统计分析,以问题为导向输出条形图、折线图、面积图、饼图、散点图、箱图等多种图形。以秦都咸阳城一号宫殿瓦当数据为例,在“图形”菜单中,“图表构建器”“图形画板模板选择器”“旧对话框”是三种常用的图形输出方式。
图表构建器
“图表构建器”是一种交互式图形生成器,由“变量框”“图表预览使用示例数据框”“图库”等相关单元框组成。图库提供多种图形,每种图形根据选取变量的不同又分为多种类型。若绘制某一图形,只需在图库中双击或将图库中某一图形直接拖入“图表预览使用示例数据框”即可。例如选用箱图,若要呈现秦都咸阳城一号宫殿不同类型瓦当直径数据分布情况,可将变量框中“类型”拖入X轴,将所要分析的瓦当直径变量拖入Y轴。有时会选取多组变量进行综合分析,可以在“组/点ID”选项卡中勾选聚类变量,然后在变量框中进行选择。标题和脚注也可根据具体需要进行设置,设置完成后点击“确定”,此时数据运算过程会在独立的“查看器”中显示。
图形画板模板选择器
“图形画板模板选择器”是一种更加智能的交互式可视化图形生成工具,根据选取的变量组合,系统自动生成符合数据运算逻辑的图形预览,供使用者选择。这种图形输出方式一方面直观高效地对数据变量进行统计,提供多种图形选择;另一方面规定了数据在科学运算下输出的几种理想方案,一定程度上减少了手动选择可能出现的纰漏。
选择“图形画板模板选择器”,在界面中选择秦都咸阳城一号宫殿瓦当数据中的“类型”“当面径”变量,右侧预览区域自动显示由这两个变量可生成的各类图形,根据需求进行选择,同时在“详细”“标题”“选项”等选项卡中对将要生成的图形进一步设置。
旧对话框
“旧对话框”中的几类图形实际是“图表构建器”中所有图形种类的精简版,除界面显示略有不同外,操作理念基本相同。以簇状条形图为例,在“旧对话框”中选择“条形图”,勾选“簇状”“个案组摘要”,点击“定义”进入“定义簇状条形图”界面。在此界面中,将左侧“当面径”变量拖入右侧“变量”框中,SPSS提供多种统计方式,包括“个案数”“个案百分比”“累计个案数”等,此处需要统计每一瓦当个案中的直径数值,所以勾选“其他统计”,默认“值的平均值”。如果不需要统计原始数据,“更改统计”菜单还提供了“标准差”“值的中位数”“方差”等多种选择。设置完变量后,需要将左侧类型变量拖入右侧“类别轴”,这是图形中X轴的分类依据。在数据库中,每一瓦当个案均附有“型式”信息,如果还需要进一步以型式进行分组,可以将左侧“型式”变量拖入右侧“聚类定义依据”中。以上所有设置完成后,点击“确定”,在“查看器”中输出图形。除条形图外,其他种类图形设置均与此类同。
单一数据变量的图形输出
单一数据变量的图形输出是较为常用的方式,它是对前文提及的三种图形输出方式更具体、更综合的应用。SPSS可以呈现瓦件某一数据变量在不同地点的总体分布特征,也可以呈现各地点各类瓦件某一数据变量的分布特征。依据单一数据变量是否分组,可分为变量无分组图形输出和变量分组图形输出。
单一数据变量无分组图形输出
单一数据变量无分组图形输出可有效对多个出土地点同一类器物数据进行观察。西汉长安城出土瓦当的地点多、数量丰富,是考察单一数据变量的较好案例。根据以往研究成果,可大致将各遗址瓦当时代划分为西汉早期至中期和西汉中期至晚期两大阶段。以西汉早期至中期各遗址瓦当直径数据为例进行分析,箱图是较为适合的呈现方式。箱图可观察数据的分布范围、平均数、中位数、二分位数、四分位数、最大值、最小值、异常值、极值等。在数据编辑器中建立西汉早期至中期瓦当数据或打开提前保存好的瓦当数据文件,之后在“图表构建器”中选择箱图,将“遗址”变量拖入X轴,将“直径”变量拖入Y轴,点击“确定”,在“查看器”中输出图形,可得到各遗址瓦当直径原始箱图。箱图显示,未央宫椒房殿遗址瓦当直径出现异常值,编号为32的瓦当,直径21cm,超出了IQR(四分位距)的1.5倍,说明在箱图较为集中的区域范围内,此瓦当直径偏大。阳陵陵园南门遗址同时出现了极值和异常值,编号57(直径15cm)和61(直径20.8cm)显示为极值;编号59(直径15.5cm)、60(直径15.5cm)和67(直径18.8cm)显示为异常值。异常值和极值的存在反映了阳陵陵园南门瓦当直径差异大。与未央宫和武库瓦当直径分布態势相比,阳陵陵园南门瓦当直径整体偏大,这一现象为讨论阳陵陵园门阙的等级问题提供了新视角。
单一数据变量分组图形输出
单一数据变量分组图形输出往往因为瓦件存在更详细的分类而得到更丰富的数据信息,箱图亦是较好的选择。以西汉长安城中期至晚期各遗址瓦当直径数据为例,使用“图形画板模板选择器”,同时选中“遗址”“纹饰”“直径”,在图形预览中选择“聚类箱图”,点击“确定”即可输出聚类箱图。聚类箱图首先根据不同遗址分类,在此基础上再根据各遗址不同类型瓦当进一步区分,形成双重分类依据。箱图显示,与云纹瓦当相比,多数遗址的文字瓦当中位数数值更高,箱形区域更集中,显示出文字瓦当规格的特殊性,这为探讨文字瓦当的使用等级提供了更为直观的线索。
数据变量的标准化处理与图形输出
瓦件的标准化研究是较为新颖的研究视角,田亚岐、腾铭予、蔡彦、马欢欢等学者运用Systat对瓦件的标准化研究为我们提供了一种新思路。此视角可以观察同一时代不同遗址或同一遗址不同时代瓦件整体和个体之间的标准化程度,进而探究工匠熟练程度、工匠流动以及手工业管理制度等问题。
与Systat统计分析方式相比,SPSS统计分析更高效、便捷。汉魏洛阳城历时性长,出土瓦件种类丰富,阶段性演变特征明显,是进行瓦件标准化分析的较好案例。汉魏洛阳城出土的各类瓦件大致分属汉晋、魏晋十六国和北魏三个时期,汉晋时期主要流行绳纹面布纹里板瓦、绳纹面布纹里筒瓦、云纹瓦当、文字瓦当;魏晋十六国时期主要流行篮纹板瓦、部分素面筒瓦、三角缘云纹瓦当;北魏时期主要流行磨光面板瓦、磨光面筒瓦、部分素面筒瓦、莲花纹瓦当、兽面纹瓦当、忍冬纹瓦当等。其中,流行于魏晋十六国时期的瓦件个体数量较少,尚难进行数据统计,本文选取数量较多的汉晋和北魏时期瓦件进行统计分析。汉晋时期板瓦67件,筒瓦65件,瓦当61件;北魏时期板瓦22件,筒瓦20件,瓦当32件。统计变量包括板瓦厚度、筒瓦厚度、瓦当厚度、瓦当边轮宽度。
在统计分析前首先要对四个变量数据进行标准化处理,SPSS默认的标准化处理方式为Z-score处理方式,公式为标准化值=(变量值-平均值)÷标准差。在SPSS中导入汉魏洛阳城汉晋和北魏时期板瓦厚度数据,在菜单栏中选择“分析”菜单,选择“描述统计”中的“描述”菜单,在描述界面,将板瓦“厚度”变量拖入变量框中,并勾选“将标准化值另存为变量”,以方便对标准化值进一步分析。同样的,将筒瓦和瓦当相关变量按照同样的方法进行标准化处理。然后使用SPSS制作板瓦厚度、筒瓦厚度、瓦当厚度、瓦当边轮宽度标准值的箱图。
箱图显示,尽管汉魏洛阳城汉晋时期板瓦和筒瓦厚度标准化值比北魏时期更为集中,但极值和异常值过多,说明汉晋时期工匠整体受到的制瓦规范约束性更弱。汉魏洛阳城北魏时期瓦当边轮宽度标准化值比汉晋时期更为集中,但两时期均存在异常值和极值现象,这反映出北魏时期瓦当边轮宽度标准化程度应当更高。北魏时期瓦当厚度的标准化值同样比汉晋时期更为集中,说明北魏时期瓦当厚度标准化程度比汉晋时期高。因此,汉魏洛阳城北魏时期瓦件整体标准化程度应高于汉晋时期,工匠受到更严格的约束和管理。与汉晋时期相比,洛阳城出土的北魏时期各类瓦件差异较大,汉晋时期流行的绳纹板瓦、绳纹筒瓦、云纹瓦当在北魏时期基本消失,代之以磨光面板瓦、素面筒瓦、磨光面筒瓦、兽面纹瓦当、莲花纹瓦当和忍冬纹瓦当等,其中多数种类瓦件与汉晋时期相比更为厚重,烧制质量高,规格较大,多磨光,尚黑色,宫城核心区域出土的瓦件特征更为明显。北魏迁都洛阳之初,孝文帝便在洛阳进行大规模营建工程,作为入主中原的少数民族政权,北魏以洛阳为都时期并没有完全沿用中原地区汉晋时期瓦件,而是沿用平城时期创制的瓦件。此时期瓦件制作工藝水平达到前所未有的高度,瓦件数据一定程度上反映出工匠生产管理体系乃至匠作制度应比汉晋时期更严格,也在一定程度上反映出北魏统治者改革创新的雄心。
以上案例表明,与瓦件传统研究相比,使用SPSS对瓦件数据进行分析具有两个明显优势:第一,SPSS可高效处理数量庞大的瓦件数据,通过绘制不同图形,将数据用更加立体、直观的方式呈现,从而发现新问题,得到新认识;第二,SPSS的运用可使瓦件制作工艺研究从宏观走向微观,为探究匠作制度提供一种工具和思路。
感谢南京大学优秀博士研究生创新能力提升计划B(202002B070)对本文的支持。
(作者为南京大学历史学院博士研究生)