论文部分内容阅读
科学计量学研究中的数据选择是定量分析的第一步,也是分析结果可信度和可行性的基本保证,但由于科学技术文献的大规模扩张,对于某一学科领域来说数据量过于庞大,因此利用期刊选取或是关键词检索获得数据样本,成为科学计量学研究的最主要途径。之所以这种途径是可行的,正是由于科学技术文献具备着自相似性,即部分和总体的相似性,但这种通过部分反映总体特征的科学性却没有得到实际的验证。科学文献与专利文献作为科学知识的重要载体,已成为科学计量学最主要的研究对象和数据来源。本文从科学文献与专利文献两方面着手,融合了科学计量学、时间序列分析、线性回归分析、分形几何等多种方法。选取纳米科技、工程制造等四个具有代表性学科领域的期刊文献和专利文献中小类较多、易于定量分析的大类为案例进行研究,对其样本数据与总体数据进行对比分析。通过对大量数据的定量分析,得到的时间序列图、散点图和线性回归数据表都显示出样本数据与总体数据的增长趋势几近一致,呈现极高的相关性,拟合度非常理想,能充分验证科学技术文献在时间尺度上的自似性。为科学计量学中的样本选取提供了理论依据。本文归纳了几种经典的科学技术文献增长模型及各模型的不足之处,然后结合分形结构中的自增长现象,提出了对科学技术文献自增长的理解,认为科技文献的增长过程本身是一种自增长现象,并且体现了自相似性。增长模型也反映出了科技文献自增长过程中的自相似性。本文中对时间轴上科学技术文献自相似性的研究反映的是科学技术文献自增长过程的部分与整体的相似性。本文通过对案例得出的结果进行分析、推测,总结了在科学计量研究中,样本数据的选取规律,定性及定量分析了自相似程度与尺度之间的关系。通过分形理论中维数定义的引入,和维数计算方法的选取,得到了一种样本选取最佳尺度的验证方法。最后选取案例中的数据对验证方法的可行性进行验证,从而为科学计量学中的数据选择提供了借鉴和指导。