论文部分内容阅读
摘 要:利用布鲁克斯(Brookes)图形法计算银杏专业核心期刊时,由于银杏专业属于农业类的狭窄专业,可采用的期刊实体样本空间狭小,且在实际统计中,期刊实体增量十分有限,即短期内通常不会有大量的新增实体样本出现,因而会产生较大的系统误差。本研究通过β图形辅助分析法得到了可靠的银杏专业核心期刊布鲁克斯图形分界点,并利用这一分界点逆推得到布鲁克斯图形法误差修正系数。
关键词:银杏专业;核心期刊;β曲线;布鲁克斯;修正系数
中图分类号:G350 文献标识号:A 文章编号:1001-4942(2010)03-0084-06
以期刊载文量为基础来筛选核心期刊,对细分专业中的研究人员及基层信息服务部门获取信息具有很高的实用价值。文献统计研究是布拉德福(Bradford)文献分散定律产生和发展的基础[1],该定律自20世纪30年代发布以来,已在多个领域的多个学科得到了实际检验以及后人的不断发展和完善。最重要的是布鲁克斯对它的发展,其分段函数式给予了布拉德福曲线更加全面和准确地描述[2],并发展了图形法,在文献计量学理论和应用方面都占有极其重要的地位,专业核心期刊的统计就是其一项重要功能。从目前已发表的s值数据[3]来看,与引文法等评价方法一样,布鲁克斯图形法大多应用于专业范围较为宽泛的学科。s是标度学科专业范围大小的指标,一般随专业范围的扩大而扩大,s≤1说明专业范围非常窄[3]。银杏专业亦是果树细分专业中典型的狭窄专业,但本研究发现,其s值大于1,为1.56,不具备非常窄专业的特征,从所采用数据样本来看,处于1994~2004年,其间经历了一个产业发展膨胀阶段,期刊载文数量也会产生相应的膨胀,但银杏专业特征并没有产生持续的变化,短期膨胀后,仍要回归狭窄专业特征。在这种情况下,如果简单套用布鲁克斯图形法,很难得到合理的计算结果,会产生很大的系统误差[8]。作为系列研究之一,本研究同样是在布鲁克斯图形法的基础上,采用了β曲线[8,9],即以布鲁克斯原模型为基础,按其β值绘制曲线,然后利用该曲线上的合理分界点作为参考点,来获得误差变化规律的曲线,从而得到布鲁克斯图形法误差修正系数x,以达到有效克服误差的目的。在目前国内发表的专业文献中,已有多篇论文[4~7]获得了该方法的支持并得到了合理的计算结果。本系列研究始于对杏专业载文核心期刊布鲁克斯误差根源的研究,并已在多个果树专业中进行了验证性研究,均取得了很好的结果。本文以银杏专业为采样数据进行研究,目的是为了进一步验证β曲线的有效性。
1 模型与定义
模型:公式1为布鲁克斯两段方程式。
式中, s是一个与N呈正比的参数,同时与C呈正相关。α=R(1),表示等级为1的期刊载文量,即载文量最多的期刊的载文量。C为核心区期刊数。β为小于1的参数,是布鲁克斯图形曲线部分的曲率,与核心区期刊数量相关。k为布鲁克斯图形中直线部分的斜率。N为期刊总数,n为期刊按载文量递减顺序排列的序号[3],即期刊累积数。
在研究杏专业载文核心期刊的统计误差[8]时,已在该公式和与之对应的图形法的基础上给出了4个定义,同样适用于对银杏专业载文核心期刊的统计进行误差分析与修正研究。
定义1:β曲线——以布鲁克斯图形各点的β值为横轴,以期刊累积数n为纵轴制作的曲线,又称β图形。
定义2:合理分界点T——在β曲线中,曲率匀加速变化的线段与曲率趋向常数的线段之交点。
定义3:不合理分界点C——在布鲁克斯图形中,如果分界点C不对应于β曲线中的T点,则C为不合理分界点。
定义4:布鲁克斯图形法修正系数x——在系统误差修正过程中对实体样本空间的最佳虚拟变换倍数。
2 数据与图形分析
2.1 数据采用与处理
表1是一组有关中国银杏专业论文的统计数据[4],其原始数据来源于中国期刊全文数据库和中文科技期刊全文数据库,这两个数据库几乎涵盖了国内所有的农业科技期刊。为便于数据引用和计算,将原创数据表中的常用对数值改为“期刊累计数自然对数值(lnn)”,表中引用的其它原始数据不变。根据该表中的数据在笛卡尔坐标纸上描图1,即为布鲁克斯图形,其分界点为C,由该点的横坐标可以求得布鲁克斯值n,即核心期刊值。
2.2 β曲线的制作与应用
在布鲁克斯图形法的基础上研究对其β值的进一步应用。由两段数学式(公式1)所得的布鲁克斯图形具有连续性,依此,β亦具连续性,因而在应用中可通过求取该图形曲线上各点的β值并作图,判断布鲁克斯图形中直观获取的分界点的合理性,即图1中C点的合理性。布鲁克斯图形法是利用分界点上的纵横坐标值来求取核心期刊的值n,本研究就是要修正该点的计算结果。
分析发现,利用布鲁克斯图形法计算狭窄专业的核心期刊时,其图形分界点位置的判断会存在较大的误差,因而,需对分界点的准确位置作进一步的分析,以便找到缩小这类误差的途径,即从图1中第一个统计点开始,假设其后的每一个统计点都是一个分界点(同时满足公式1①和公式1②条件的点),这样就可针对每一个实际统计点利用公式1①逐一计算其曲率β,并制作曲线,即定义中的“β曲线”。利用指数与对数法则将公式1①转换为公式2:
β=logR(n)R(1)n=lgR(n)R(1)lgn=lgR(n)-lgR(1)lgn=lgR(n)-lg84lgn (公式2)
将表1中各已知量代入公式2,得到对应的β值(表2)。分别以n值和β值为纵横坐标描图2。β图形更加直观和清晰,容易找出β值趋于一致的线段边际,因而能够更加准确地发现合理分界点的影射点,最大限度地避免仅仅依靠图1来确定分界点所带来的系统误差。
2.3 图形对比与误差分析
在研究杏[8]、山楂[9]、枣、核桃、猕猴桃[10]等细分狭窄专业的分界点时,发现如下规律:一是当专业发展比较稳定时,布鲁克斯图形的分界点位于β图形中离核心区最近且匀加速变化阶段的线段上,此时可以确定该线段上方的端点即为合理分界点;二是当专业发展急剧膨胀时,布鲁克斯图形的分界点位于β图形中匀加速变化阶段的线段顶端或顶端以外趋向于垂直于横轴的射线上的近端点处,此时的分界点应视布鲁克斯图形曲线部分的状况而定。以上两种情况的β图形均存在一条由多个统计点构成的规则斜线,即β值匀加速变化的线段。对发展一直较为平稳的专业突然出现急剧萎缩的情况尚没有典型实例可供研究。银杏专业在统计期间也出现了膨胀式发展情况,即90年代中后期出现的众所周知的银杏热,如江苏姜堰近几年白果收购价格在5元/kg以下徘徊,2008年收购价甚至跌破了2元/kg[10]。直观上看,在图2中前5个统计点对应于图1靠近核心区的明显的曲线部分,因此,不管它们是否存在拐点均不予讨论。ET是匀加速变化且离核心区最近的线段,T点明显地处于匀加速变化线段的顶端,可判定为核心区与发散区的分界点,这与本系列研究中以往的研究实例中出现的情况相符。 在图1中,布鲁克斯图形分界点为C,格鲁斯下垂区为273 R(24)=84×24β 即,84×24β=839,则β=log9.98824=lg9.988lg24=0.7242
此处β<1,说明所采用的数据符合布鲁克斯公式的条件要求,而该点在图2中的影射点为C′, 显然C′已大大超出了β匀加速变化区(ET线段),进入了文献发散区,这就难以判断C是否是合理分界点。从图1来看,从第11统计点T′(对应于图2的T点)到C点,已完全表现为一条规则的直线,其与布鲁克斯直线部分形成的剪刀差也正反映了本专业的发展出现过比较大的波动并在C点表现出来,由此可见,合理分界点应处于C点的下方, C则是“不合理分界点”。而图2中11.25≤n≤273.00范围内则是一条趋向垂直于横轴的直线,这在杏专业等核心期刊的误差研究中也得到了证实,因此,可以判定此范围对应于图1的直线部分,至此,可将图2中的曲率分界点T判定为“合理分界点”,该点有nβ=11.25≈11,从而确认了T点的纵坐标11.25即为核心期刊值,这与区域法[4~7]所获得的结果相符[4]。这样便可以通过公式计算找到传统布鲁克斯图形对应于T点的真实分界点,从而对布鲁克斯图形给出的结果进行修正。在图1中,核心区与发散区的分界点除作图与判定误差外,对照区域法[4]计算结果,利用这一分界点所产生的系统误差则更大,是误差的主要因素。经试验证明,在该点通过对s值进行变换可以有效缩小对核心期刊统计的系统误差,由于N与s呈正比[3],其数学意义是对实体样本空间进行了变换,这种变换是以β图形中T点为依据的。
下面给出了两种情况下的相对误差:
(1)假设样本空间足够大,则k≈N [3]=474,C点有R(24)=839,由图1读取s=1.56,由公式1②对其进行布鲁克斯求值得n=9.16,而该点实际的期刊数nc=24.00(表2),其相对误差Δnc=|nc-n |=|24.00-9.16|=14.84,相对误差率为Δnc/nc=61.84%。
(2)图上读取相对误差:由图1读取C点的lnn=3.18,则n=24,二者进行比较后发现,Δn=|nβ-n |=|11.25-24.00|=12.75,相对误差率为Δn/nβ=113.33%。
第一种情况表明,对于该实例k≈N是不成立的,即N并不是足够大;第二种情况则显示了两个图形读取值的差别,两种情况下的Δn值实际上都已超出了误差涵义,显示了布鲁克斯模型在这个专业的应用中其传统的使用方法存在着缺陷,而出自同一模型的β图形中T点的结果则表明布鲁克斯公式本身并不存在这样的缺陷,仅有作图及判断误差。这看起来似乎是矛盾的,实质上这正说明在两段数学表达式中不同的段代表着不同的含义,这种显著的差异也正是在狭窄专业中段的使用不合理所造成的,从而使得修正原先的布鲁克斯模型使用方法有了依据。由于误差是系统性的,因而误差修正应基于公式的计算结果。
3 银杏专业核心期刊的计算与误差修正
3.1 k值的求取
s是标度学科专业范围大小的指标,一般随专业范围的扩大而扩大[3]。在图1中,沿直线作延长线交于横轴A点,A点所对应的自然对数值即为s,这里读取s=lnA=1.56。在误差修正过程中,一经读取就一直假设该值没有作图误差,是直线在横轴上的截距(平移量)。
k值即布鲁克斯图形中直线部分的斜率,由于误差因素,不能以任意统计点的纵横比来求取,而应求取直线部分的每个统计点的实际值,尔后再取其平均值,这样会最大限度地缩小计算误差与作图误差。直观上看,图1中的第19统计点C是分界点,即k值的计算从第19统计点开始,到格鲁斯下垂的分界点为止。由直线方程式R(n)=k(lnn-s)求取直线部分各统计点的k值,列表3。k的平均值为:
=∑33m=19k15=509.83
3.2 n值相对误差分析
当期刊总数N充分大时,有N≈k[3],而目前的N=474 R(24)=84n0.7242 (1≤n≤24)①ln(n/xlnA) (24≤n≤318)②(公式3)
式中,x即为布鲁克斯图形法修正系数。本系数用于在布鲁克斯模型的基础上,对狭窄专业核心期刊的统计结果进行修正。由于公式3①所对应的图形是布鲁克斯的曲线部分,正常情况下合理分界点应是右边的端点,因此,计算只要使用公式3②即可,也就是从不合理分界点C开始,按n的顺序进行。表4列出了通过公式3②计算得到的部分布鲁克斯n值,s取0.80~1.90倍,对合理分界点的相对误差为:δ=│nβ-n│=│11.25-n│,利
用这一公式所获得的最小误差值所对应的n值就是逆向推理的依据,即利用β图形所获得的结果确定公式1中n的结果,再利用这个结果反向求取该方程式的一个因子x,这个x必须对应于最小的 ,加入这一因子后,使布鲁克斯公式可以直接在银杏这个狭窄专业中应用而不致产生错误。适当加密x值描点作图3。
由表4和图3可以看出,在计算和作图误差范围内,当银杏专业载文期刊样本空间扩大为实体样本空间的1.39倍(x=1.39)时,所产生的相对误差最小,为0.008755。
3.3 修正系数的应用
将x=1.39代入公式3②进行应用计算,即可将核心期刊数n修正到nβ,即:
lnn=R(24)+lns=R(24)+ln(xlnA)=839509.83+ln(1.39×1.56)=2.4196
得此时银杏专业核心期刊数为n=11.24≈11,这样得出的结果与区域法[4~7]所获得的结果相符[4]。
4 结论
本文通过对银杏专业载文核心期刊统计实例的研究,获得了β图形辅助分析法并逆推获得了该专业布鲁克斯图形法修正系数x。从统计结束日开始,今后相当长的一段时间内,由于银杏专业载文实体期刊样本的增量极其微小,因而在该时间区段内可将x视为一个常数使用,这为类似专业的应用计算提供了新的量化依据。同时也显示了β曲线、合理分界点T、不合理分界点C和布鲁克斯图形法修正系数x这4个定义的必要性,可以将其推广到其它狭窄专业载文核心期刊的统计中去。本系列研究的成果已为多篇文献[4~7]的发表提供了支持,并得到了理想的统计结果,这些结果都得到了区域法的验证。作为系列研究之一,本研究并不涉及布鲁克斯模型本身是否存在缺陷问题,而只是研究了该模型在银杏这个狭窄专业载文核心期刊的统计中,其传统的使用方法因段的使用不合理所产生的问题,并给出了弥补的有效方法。同时,本研究也并不与现有的引文法等权威评价标准产生冲突,它只是为细分狭窄专业及基层信息服务部门的信息需求者提供了一个便捷的实用筛选工具。
参 考 文 献:
[1] 邱均平.信息计量学[M]. 武汉:武汉大学出版社,2000,315-316.
[2] Brookes B C.Bradford’s law and the bibliography of science[J]. Nature,1969,224:953-956.
[3] 庞景安. 科学计量研究方法论[M]. 北京:科学技术文献出版社, 2002,168-173.
[4] 张 毅,秦志华,沈广宁. 1994~2004年银杏专业研究文献计量分析[J]. 中国农学通报, 2007,23(4):419-425.
[5] 张 毅,杜方岭. 1994~2002年杏专业研究文献计量分析[J]. 农业图书情报学刊,2004, 5:153-158.
[6] 张 毅.1994~2002年山楂研究文献计量分析[J]. 农业图书情报学刊,2004, 15(1):95-96.
[7] 杜方岭,张 毅. 1994~2002年核桃专业研究文献计量分析[J]. 农业图书情报学刊,2005, 17(4):143-147.
[8] 孙洪雁,苏胜茂,王金政. 杏专业载文核心期刊布鲁克斯误差分析与修正[J]. 山东农业大学学报,2009,40(4):609-614.
[9] 孙洪雁, 马 青. 山楂专业载文核心期刊布鲁克斯误差分析与修正[J].图书情报工作,2009,53(18):66-69,95.
[10]孙洪雁,赵红军,张 琮,等. 猕猴桃专业载文核心期刊布鲁克斯误差分析与修正[J]. 山东农业科学,2010,2:89-94.
[11]姜堰银杏产业发展前景分析[EB/OL]. 江苏林业网, http://www.jsforestry.gov.cn/jsly/showinfo,2009-10-09 .
关键词:银杏专业;核心期刊;β曲线;布鲁克斯;修正系数
中图分类号:G350 文献标识号:A 文章编号:1001-4942(2010)03-0084-06
以期刊载文量为基础来筛选核心期刊,对细分专业中的研究人员及基层信息服务部门获取信息具有很高的实用价值。文献统计研究是布拉德福(Bradford)文献分散定律产生和发展的基础[1],该定律自20世纪30年代发布以来,已在多个领域的多个学科得到了实际检验以及后人的不断发展和完善。最重要的是布鲁克斯对它的发展,其分段函数式给予了布拉德福曲线更加全面和准确地描述[2],并发展了图形法,在文献计量学理论和应用方面都占有极其重要的地位,专业核心期刊的统计就是其一项重要功能。从目前已发表的s值数据[3]来看,与引文法等评价方法一样,布鲁克斯图形法大多应用于专业范围较为宽泛的学科。s是标度学科专业范围大小的指标,一般随专业范围的扩大而扩大,s≤1说明专业范围非常窄[3]。银杏专业亦是果树细分专业中典型的狭窄专业,但本研究发现,其s值大于1,为1.56,不具备非常窄专业的特征,从所采用数据样本来看,处于1994~2004年,其间经历了一个产业发展膨胀阶段,期刊载文数量也会产生相应的膨胀,但银杏专业特征并没有产生持续的变化,短期膨胀后,仍要回归狭窄专业特征。在这种情况下,如果简单套用布鲁克斯图形法,很难得到合理的计算结果,会产生很大的系统误差[8]。作为系列研究之一,本研究同样是在布鲁克斯图形法的基础上,采用了β曲线[8,9],即以布鲁克斯原模型为基础,按其β值绘制曲线,然后利用该曲线上的合理分界点作为参考点,来获得误差变化规律的曲线,从而得到布鲁克斯图形法误差修正系数x,以达到有效克服误差的目的。在目前国内发表的专业文献中,已有多篇论文[4~7]获得了该方法的支持并得到了合理的计算结果。本系列研究始于对杏专业载文核心期刊布鲁克斯误差根源的研究,并已在多个果树专业中进行了验证性研究,均取得了很好的结果。本文以银杏专业为采样数据进行研究,目的是为了进一步验证β曲线的有效性。
1 模型与定义
模型:公式1为布鲁克斯两段方程式。
式中, s是一个与N呈正比的参数,同时与C呈正相关。α=R(1),表示等级为1的期刊载文量,即载文量最多的期刊的载文量。C为核心区期刊数。β为小于1的参数,是布鲁克斯图形曲线部分的曲率,与核心区期刊数量相关。k为布鲁克斯图形中直线部分的斜率。N为期刊总数,n为期刊按载文量递减顺序排列的序号[3],即期刊累积数。
在研究杏专业载文核心期刊的统计误差[8]时,已在该公式和与之对应的图形法的基础上给出了4个定义,同样适用于对银杏专业载文核心期刊的统计进行误差分析与修正研究。
定义1:β曲线——以布鲁克斯图形各点的β值为横轴,以期刊累积数n为纵轴制作的曲线,又称β图形。
定义2:合理分界点T——在β曲线中,曲率匀加速变化的线段与曲率趋向常数的线段之交点。
定义3:不合理分界点C——在布鲁克斯图形中,如果分界点C不对应于β曲线中的T点,则C为不合理分界点。
定义4:布鲁克斯图形法修正系数x——在系统误差修正过程中对实体样本空间的最佳虚拟变换倍数。
2 数据与图形分析
2.1 数据采用与处理
表1是一组有关中国银杏专业论文的统计数据[4],其原始数据来源于中国期刊全文数据库和中文科技期刊全文数据库,这两个数据库几乎涵盖了国内所有的农业科技期刊。为便于数据引用和计算,将原创数据表中的常用对数值改为“期刊累计数自然对数值(lnn)”,表中引用的其它原始数据不变。根据该表中的数据在笛卡尔坐标纸上描图1,即为布鲁克斯图形,其分界点为C,由该点的横坐标可以求得布鲁克斯值n,即核心期刊值。
2.2 β曲线的制作与应用
在布鲁克斯图形法的基础上研究对其β值的进一步应用。由两段数学式(公式1)所得的布鲁克斯图形具有连续性,依此,β亦具连续性,因而在应用中可通过求取该图形曲线上各点的β值并作图,判断布鲁克斯图形中直观获取的分界点的合理性,即图1中C点的合理性。布鲁克斯图形法是利用分界点上的纵横坐标值来求取核心期刊的值n,本研究就是要修正该点的计算结果。
分析发现,利用布鲁克斯图形法计算狭窄专业的核心期刊时,其图形分界点位置的判断会存在较大的误差,因而,需对分界点的准确位置作进一步的分析,以便找到缩小这类误差的途径,即从图1中第一个统计点开始,假设其后的每一个统计点都是一个分界点(同时满足公式1①和公式1②条件的点),这样就可针对每一个实际统计点利用公式1①逐一计算其曲率β,并制作曲线,即定义中的“β曲线”。利用指数与对数法则将公式1①转换为公式2:
β=logR(n)R(1)n=lgR(n)R(1)lgn=lgR(n)-lgR(1)lgn=lgR(n)-lg84lgn (公式2)
将表1中各已知量代入公式2,得到对应的β值(表2)。分别以n值和β值为纵横坐标描图2。β图形更加直观和清晰,容易找出β值趋于一致的线段边际,因而能够更加准确地发现合理分界点的影射点,最大限度地避免仅仅依靠图1来确定分界点所带来的系统误差。
2.3 图形对比与误差分析
在研究杏[8]、山楂[9]、枣、核桃、猕猴桃[10]等细分狭窄专业的分界点时,发现如下规律:一是当专业发展比较稳定时,布鲁克斯图形的分界点位于β图形中离核心区最近且匀加速变化阶段的线段上,此时可以确定该线段上方的端点即为合理分界点;二是当专业发展急剧膨胀时,布鲁克斯图形的分界点位于β图形中匀加速变化阶段的线段顶端或顶端以外趋向于垂直于横轴的射线上的近端点处,此时的分界点应视布鲁克斯图形曲线部分的状况而定。以上两种情况的β图形均存在一条由多个统计点构成的规则斜线,即β值匀加速变化的线段。对发展一直较为平稳的专业突然出现急剧萎缩的情况尚没有典型实例可供研究。银杏专业在统计期间也出现了膨胀式发展情况,即90年代中后期出现的众所周知的银杏热,如江苏姜堰近几年白果收购价格在5元/kg以下徘徊,2008年收购价甚至跌破了2元/kg[10]。直观上看,在图2中前5个统计点对应于图1靠近核心区的明显的曲线部分,因此,不管它们是否存在拐点均不予讨论。ET是匀加速变化且离核心区最近的线段,T点明显地处于匀加速变化线段的顶端,可判定为核心区与发散区的分界点,这与本系列研究中以往的研究实例中出现的情况相符。 在图1中,布鲁克斯图形分界点为C,格鲁斯下垂区为273
此处β<1,说明所采用的数据符合布鲁克斯公式的条件要求,而该点在图2中的影射点为C′, 显然C′已大大超出了β匀加速变化区(ET线段),进入了文献发散区,这就难以判断C是否是合理分界点。从图1来看,从第11统计点T′(对应于图2的T点)到C点,已完全表现为一条规则的直线,其与布鲁克斯直线部分形成的剪刀差也正反映了本专业的发展出现过比较大的波动并在C点表现出来,由此可见,合理分界点应处于C点的下方, C则是“不合理分界点”。而图2中11.25≤n≤273.00范围内则是一条趋向垂直于横轴的直线,这在杏专业等核心期刊的误差研究中也得到了证实,因此,可以判定此范围对应于图1的直线部分,至此,可将图2中的曲率分界点T判定为“合理分界点”,该点有nβ=11.25≈11,从而确认了T点的纵坐标11.25即为核心期刊值,这与区域法[4~7]所获得的结果相符[4]。这样便可以通过公式计算找到传统布鲁克斯图形对应于T点的真实分界点,从而对布鲁克斯图形给出的结果进行修正。在图1中,核心区与发散区的分界点除作图与判定误差外,对照区域法[4]计算结果,利用这一分界点所产生的系统误差则更大,是误差的主要因素。经试验证明,在该点通过对s值进行变换可以有效缩小对核心期刊统计的系统误差,由于N与s呈正比[3],其数学意义是对实体样本空间进行了变换,这种变换是以β图形中T点为依据的。
下面给出了两种情况下的相对误差:
(1)假设样本空间足够大,则k≈N [3]=474,C点有R(24)=839,由图1读取s=1.56,由公式1②对其进行布鲁克斯求值得n=9.16,而该点实际的期刊数nc=24.00(表2),其相对误差Δnc=|nc-n |=|24.00-9.16|=14.84,相对误差率为Δnc/nc=61.84%。
(2)图上读取相对误差:由图1读取C点的lnn=3.18,则n=24,二者进行比较后发现,Δn=|nβ-n |=|11.25-24.00|=12.75,相对误差率为Δn/nβ=113.33%。
第一种情况表明,对于该实例k≈N是不成立的,即N并不是足够大;第二种情况则显示了两个图形读取值的差别,两种情况下的Δn值实际上都已超出了误差涵义,显示了布鲁克斯模型在这个专业的应用中其传统的使用方法存在着缺陷,而出自同一模型的β图形中T点的结果则表明布鲁克斯公式本身并不存在这样的缺陷,仅有作图及判断误差。这看起来似乎是矛盾的,实质上这正说明在两段数学表达式中不同的段代表着不同的含义,这种显著的差异也正是在狭窄专业中段的使用不合理所造成的,从而使得修正原先的布鲁克斯模型使用方法有了依据。由于误差是系统性的,因而误差修正应基于公式的计算结果。
3 银杏专业核心期刊的计算与误差修正
3.1 k值的求取
s是标度学科专业范围大小的指标,一般随专业范围的扩大而扩大[3]。在图1中,沿直线作延长线交于横轴A点,A点所对应的自然对数值即为s,这里读取s=lnA=1.56。在误差修正过程中,一经读取就一直假设该值没有作图误差,是直线在横轴上的截距(平移量)。
k值即布鲁克斯图形中直线部分的斜率,由于误差因素,不能以任意统计点的纵横比来求取,而应求取直线部分的每个统计点的实际值,尔后再取其平均值,这样会最大限度地缩小计算误差与作图误差。直观上看,图1中的第19统计点C是分界点,即k值的计算从第19统计点开始,到格鲁斯下垂的分界点为止。由直线方程式R(n)=k(lnn-s)求取直线部分各统计点的k值,列表3。k的平均值为:
=∑33m=19k15=509.83
3.2 n值相对误差分析
当期刊总数N充分大时,有N≈k[3],而目前的N=474
式中,x即为布鲁克斯图形法修正系数。本系数用于在布鲁克斯模型的基础上,对狭窄专业核心期刊的统计结果进行修正。由于公式3①所对应的图形是布鲁克斯的曲线部分,正常情况下合理分界点应是右边的端点,因此,计算只要使用公式3②即可,也就是从不合理分界点C开始,按n的顺序进行。表4列出了通过公式3②计算得到的部分布鲁克斯n值,s取0.80~1.90倍,对合理分界点的相对误差为:δ=│nβ-n│=│11.25-n│,利
用这一公式所获得的最小误差值所对应的n值就是逆向推理的依据,即利用β图形所获得的结果确定公式1中n的结果,再利用这个结果反向求取该方程式的一个因子x,这个x必须对应于最小的 ,加入这一因子后,使布鲁克斯公式可以直接在银杏这个狭窄专业中应用而不致产生错误。适当加密x值描点作图3。
由表4和图3可以看出,在计算和作图误差范围内,当银杏专业载文期刊样本空间扩大为实体样本空间的1.39倍(x=1.39)时,所产生的相对误差最小,为0.008755。
3.3 修正系数的应用
将x=1.39代入公式3②进行应用计算,即可将核心期刊数n修正到nβ,即:
lnn=R(24)+lns=R(24)+ln(xlnA)=839509.83+ln(1.39×1.56)=2.4196
得此时银杏专业核心期刊数为n=11.24≈11,这样得出的结果与区域法[4~7]所获得的结果相符[4]。
4 结论
本文通过对银杏专业载文核心期刊统计实例的研究,获得了β图形辅助分析法并逆推获得了该专业布鲁克斯图形法修正系数x。从统计结束日开始,今后相当长的一段时间内,由于银杏专业载文实体期刊样本的增量极其微小,因而在该时间区段内可将x视为一个常数使用,这为类似专业的应用计算提供了新的量化依据。同时也显示了β曲线、合理分界点T、不合理分界点C和布鲁克斯图形法修正系数x这4个定义的必要性,可以将其推广到其它狭窄专业载文核心期刊的统计中去。本系列研究的成果已为多篇文献[4~7]的发表提供了支持,并得到了理想的统计结果,这些结果都得到了区域法的验证。作为系列研究之一,本研究并不涉及布鲁克斯模型本身是否存在缺陷问题,而只是研究了该模型在银杏这个狭窄专业载文核心期刊的统计中,其传统的使用方法因段的使用不合理所产生的问题,并给出了弥补的有效方法。同时,本研究也并不与现有的引文法等权威评价标准产生冲突,它只是为细分狭窄专业及基层信息服务部门的信息需求者提供了一个便捷的实用筛选工具。
参 考 文 献:
[1] 邱均平.信息计量学[M]. 武汉:武汉大学出版社,2000,315-316.
[2] Brookes B C.Bradford’s law and the bibliography of science[J]. Nature,1969,224:953-956.
[3] 庞景安. 科学计量研究方法论[M]. 北京:科学技术文献出版社, 2002,168-173.
[4] 张 毅,秦志华,沈广宁. 1994~2004年银杏专业研究文献计量分析[J]. 中国农学通报, 2007,23(4):419-425.
[5] 张 毅,杜方岭. 1994~2002年杏专业研究文献计量分析[J]. 农业图书情报学刊,2004, 5:153-158.
[6] 张 毅.1994~2002年山楂研究文献计量分析[J]. 农业图书情报学刊,2004, 15(1):95-96.
[7] 杜方岭,张 毅. 1994~2002年核桃专业研究文献计量分析[J]. 农业图书情报学刊,2005, 17(4):143-147.
[8] 孙洪雁,苏胜茂,王金政. 杏专业载文核心期刊布鲁克斯误差分析与修正[J]. 山东农业大学学报,2009,40(4):609-614.
[9] 孙洪雁, 马 青. 山楂专业载文核心期刊布鲁克斯误差分析与修正[J].图书情报工作,2009,53(18):66-69,95.
[10]孙洪雁,赵红军,张 琮,等. 猕猴桃专业载文核心期刊布鲁克斯误差分析与修正[J]. 山东农业科学,2010,2:89-94.
[11]姜堰银杏产业发展前景分析[EB/OL]. 江苏林业网, http://www.jsforestry.gov.cn/jsly/showinfo,2009-10-09 .