论文部分内容阅读
[摘要]文章应用大数据的研究方法,对2003~2012年收录在中文核心期刊数据库、CSSCI数据库和CSCD数据库中的16024篇旅游学术论文进行全样本的统计和研究,并对刊载旅游学术论文的期刊、旅游院校和科研机构以及论文作者进行了初步的评价和排序,较为全面地展示了近十年来我国旅游学术共同体的发展格局和分类结构,对于认识和评价我国旅游学术发展水平具有一定的指导作用,在研究方法上也具有一定的创新性,发现了以往同类研究中未被揭示的现象和问题,为推动我国旅游学术研究的大数据应用奠定了一定的基础。
[关键词]旅游;学术共同体;学术期刊;大数据;排序
[中图分类号]F59
[文献标识码]A
[文章编号]1002-5006(2013)10-0114-012
一、问题的提出
近十年是我国旅游业发展处于转型升级的时期,也是旅游研究的黄金十年。2011年,全国开设旅游系(专业)的普通高等院校已达1115所,而2002年仅407所,十年期间平均增长10.6%。而同期旅行社和星级饭店的数量年均增长率分别为7.4%和2.8%,旅游教学和学术研究的队伍不断壮大。2008年6月,国家旅游局成立了颇具规模的中国旅游研究院,表明了旅游行业最高管理部门也开始重视旅游学术研究。经过30多年的改革开放和旅游发展,我国旅游研究已经逐步走出早期理论研究滞后于行业实践的困境,呈现了理论研究指导行业实践,科学研究适度超前的良好态势,形成了以多学科和跨学科交叉融合的旅游学术研究个人与团队。一门学科的生存与发展必须有一批从事研究本学科领域的专家学者队伍,一批高质量的研究成果和一批以刊载旅游学术论文为主或经常刊载旅游学术论文的学术期刊,这些就是所谓的“学术共同体”。旅游学术共同体的形成和发展壮大是旅游研究可持续发展的基础和保障。
建设世界旅游强国是一个涉及全行业、全产业链和全社会的系统工程,需要旅游学术共同体的智力支持和科技支撑。学术期刊是学术成果交流的主要载体,学术论文是联系作者与期刊之间的纽带,也是反映学科发展水平的晴雨表。本研究以2003~2012年在国内学术期刊上发表的学术论文为研究对象,审视和评价近十年来我国旅游学术共同体的发展现状、结构特征、空间分布和分类评价。
二、文献综述
通过统计学术期刊上发表论文的作者简历(年龄、性别、学历、职称和工作单位等)、论文主题、关键词、学科归属等信息,来认识和评估某一学科的现状格局、存在的问题和发展趋势,是一种较为简易、直接、有效和常用的研究方法。在旅游学科,有不少学者做过类似的研究,其中以《旅游学刊》为单一研究样本的论文就为数不少:如赵幼芳通过对1990~1999年期间《旅游学刊》文献库的统计研究该刊的作者人群和研究旨趣;吴必虎等通过研究《旅游学刊》1986年创刊至1999年所载的全部论文来分析中国旅游学术研究的态势;曹诗图和胡书玲以《旅游学刊》为例,对我国旅游研究进行检视与反思;曾丽则从2000~2009年《旅游学刊》载文的统计来探究旅游学术研究的发展;董晓莉等通过对《旅游学刊》关键词的分析来解析中国旅游研究的知识体系。也有不少学者通过研究国际旅游权威学术期刊《旅游研究纪事》(Annals of TourismResearch)来认识国际旅游学术界的研究动态。如张立生通过《旅游研究纪事》文献来分析国外旅游学研究进展,吴宇华则以此来阐述国外旅游学科体系的建构;吴必虎、邢珏珏等通过对《旅游研究纪事》30年的文献统计,分别研究了旅游学学科树构建、时空特征分析以及旅游学分支学科相关性动态演化研究。朱竑等通过《旅游学刊》和《旅游研究纪事》文献比较来研究中外旅游研究的异同和趋向。
有的学者以多种相关的学术期刊作为研究样本,如汪德根等通过《地理学报》、《地理研究》、《地理科学》和《自然资源学报》研究近20年中国旅游地理学的发展历程,以及与之进行国内外旅游学术比较研究;张凌云等对我国4种旅游学术期刊的论文统计来分析中国旅游学术研究现状与发展趋势。
随着我国数字图书馆和学术文献数据库如中国知网(CNKI)、维普网(VIP)和万方数据(WanfangData)、中国学位论文库(CDDB)等不断丰富完善,使得文献资料收集和数据处理都变得更加便利和更有效率。刘人怀等以CSSCI收录的旅游研究文献来探讨我国旅游学学科发展;廉同辉等也同样应用CSSCI分析了2000~2010年我国旅游学科知识图谱;冯凌等基于期刊论文库研究了中国旅游学术研究30年的发展历程与内生规律;张薇等基于SCIE、SSCI和A&HCI国际三大检索文献研究了1998~2007年全球旅游研究进展;孙业红等利用国内外旅游类核心期刊论文数据库研究了2001~2012年中国旅游研究的国际影响力。类似地,刘庆余利用国家基金项目库研究20年来国家自然、社科基金旅游项目反映的学术态势,来总结中国旅游研究进展;朱峰等则通过国家自然、社会科学基金旅游类项目的分析,反思了旅游研究中存在的“去旅游化”现象。
此外,章锦河等研究了我国旅游类博士硕士学位论文,陈德广从我国旅游博士论文选题分布来研究我国旅游学科的发展,以及与北美旅游地理博士论文进行了比较研究;唐顺英利用博士学位论文库分析了近十年中国旅游类博士学位论文的选题和类型。一般而言,论文的学术价值与期刊的学术地位有着较大的关联性,大多数学者是利用学术期刊平台来研究论文。而兰超英和张凌云则是利用所载论文来研究我国旅游学术期刊影响力和影响因子。张凌云在线检索和整理的160种国际旅游学术期刊,其中英文期刊132种,其他语种27种(不包括中文期刊),并给出了35种英文主要旅游学术期刊的主编、主编工作单位以及出版方等信息,对其中的20种学术期刊选题方向进行了分类统计,研究我国学者利用《旅游研究纪事》和《旅游管理》进行国外研究综述和中外旅游比较研究的状况。 在国外,谢尔顿(Sheldon)、乔噶南等(Jogaratnam,et al.)分别分析了1980~1989年和1992~2001年学术机构对于《旅游研究纪事》、《旅行研究杂志》(Journal of Travel Research)和《旅游管理》(Tourism Management)等3本旅游学术期刊的论文贡献;瑞安(Ryan)以35种旅游、酒店管理、休闲和旅游文化等相关学术期刊上发表论文在线被点击的数量,对刊物和作者进行了排序;麦克切尔等(Mckwecher,et al.)研究了旅游与酒店管理类学术期刊的评价方法。近年来,国外同类研究中影响较大的是帕克等(Park,et al.)在《接待业与旅游研究杂志》(Journal of Hospitality and TourismResearch)发表的“新千年的第一个十年:酒店及旅游研究——根据6种杂志按照作者、大学和国家进行排序”,其成果已受到国际旅游学术界的普遍关注。
上述国内论文对于认识我国某一时期,某一方面的旅游学术研究概貌和基本特征具有很强的指导意义和参考价值。但是,由于旅游学科具有综合性、交叉和跨学科等特点,目前,旅游学科并没有发展成为一门相对独立的学科,而是寄生在其他学科中成为该学科的一个分支,缺乏母学科的归属。在高等教育系统中旅游归于管理学门类之下,在出版系统又将其归为地理类,如《旅游学刊》是与《人文地理》和《经济地理》划为同一类别,而在图书管理系统(中图法)中,旅游归入经济学门类。正是由于旅游学科的这一特性,使得上述研究涉及的样本数和样本框都受到了较大的局限。上述成果中样本数量最多的也只抽取了3000多篇论文(且研究的时间跨度为10年,平均每年不足300篇),少的只有几百篇,而抽样范围也主要集中在几本刊物上。事实上,旅游论文的分布具有类似于长尾理论(The Long Tail)的学科分散性,仅统计几本旅游或与旅游学科密切相关的学术期刊,无法全面认识和客观评价旅游学术共同体的学术成果和学科建设。
同样地,帕克等只是选取《接待业与旅游研究杂志》、《国际酒店管理杂志》(International Journal of Hospitality Management)、《康奈尔酒店季刊》(Cornell Hospitality Quarterly)、《旅游管理》、《旅游研究纪事》、《旅行研究杂志》等6本旅游学术期刊(共选取了10年期间发表的2834篇论文,平均每年283.4篇),来研究全球的旅游学术概貌,其结论难免以偏概全。目前,进入SSCI的旅游类(包括户外运动和休闲)学术期刊已经达到35种之多,而帕克等只是在酒店和旅游的学术刊物中各选取了3种,像《可持续旅游》(Journal of Sustainable Tourism)、《旅游地理学》(Tourism Geographies)、《旅游经济学》(Tourism Economics)等均未列入,更何况一些旅游学术论文是发表在地理学、管理学、经济学、社会学(民族学、人类学)、心理学、生态学等主流学术期刊上的。如英国学者巴勒特(Butler)关于旅游目的地生命周期理论的著名论文就是发表在《加拿大地理学家》(Canadian Geographer),一本影响力不大的非旅游学术期刊。又如以色列著名的旅游社会学家科恩(Cohen)一些有影响的论文大多发表在《社会学年度评论》(Annual Review of Sociology)、《社会学》(Sociology)和《社会学研究》(Social Research)等社会学主流刊物上。
三、方法与数据
衡量作者、大学和研究机构对学术研究的贡献一般采用的方法有:问卷调查、引文分析、内容分析和德菲尔法。但这些研究都是基于小数据的抽样调查。如前所述,旅游学科分别散布于各个学科门下,刊物名称中含旅游的寥寥无几,而进入北大核心期刊的仅《旅游学刊》一种,进入南大核心(CSSCI来源期刊)的也只有《旅游学刊》、《旅游科学》两种,以及南大核心扩展版的《旅游论坛》。这就意味着大量的旅游学术论文都是发表在非旅游刊物上的。兰超英等应用布拉福德分散定律(Bradford’s law of scattering),对中国期刊全文数据库(Chinese Journal Full-text Database)、维普和万方3个数据库中的6367种期刊刊载的80831篇论文进行了检索,确定了89种期刊为核心区刊物(但未剔除非中文核心期刊和非CSSCI来源期刊),并对核心区期刊的载文量、被引频次、下载频次和影响因子进行测量和评价。尽管89种期刊数量已经较之以往的研究放大了许多倍,但从方法论上看,仍属于小数据的抽样。事实上,旅游学科的论文分布非常类似于安德森(Anderson)提出的长尾理论。因此,本研究尝试大数据(big data)的方法,让数据说话,通过更多和更杂的数据,达到更好的效果。具体地说,大数据遵循以下3个原则:1)利用所有的数据,而不再仅仅依靠一小部分数据,全数据模式就是,样本=总体;2)允许数据的混杂性,不苛求精确性;3)不强调因果关系,而是看重相关关系。
综上,本文采用全样本的研究方法。在中文核心期刊数据库、CSSCI数据库(不计扩展版)、CSCD数据库中分别设计了25组字段进行“题名”或“关键词”进行检索(时间跨度为2003~2012年),共得出74497篇文献。对这些文献再从“作者、年份、标题、期刊”等多个方面对各数据内部和各数据之间跨库进行查重,并经删除发表在增刊上的文献,以及会议通知、会议报道、专访、征稿启事、广告等非学术性文章,论文数量还剩下20895篇。最后,再根据出刊周期,剔除旬刊、周刊和半月刊等出版周期较短的刊物,得到论文样本数为16024篇。
为了使本研究的成果便于国际比较,在评价和计分时,采用帕克等的标准和口径。1)作者评价和计分:假设一篇文章有Ⅳ个作者,则每个作者的得分为1/N,将该作者每篇文章的得分相加即得“总分”,按作者出现的频次统计“文章总数”(作者现任职为2013年8月通过各作者机构官方网站查询得出);2)作者单位的处理:仅计一级学校和单位,分校、二级学院及下属部门均纳入一级范围内。假设一篇文章有Ⅳ个作者,某一作者分属M个作者单位,则该文章下属的每个作者单位得分为1/NM。频次N指某一单位在Ⅳ篇文章中出现过。 目前,旅游学科的分类归属在旅游学术界内还存在着不同的意见。此外,学术界和出版界对于旅游学科的分类差异更大。本研究采取国家标准《学科分类与代码》(GB/T 13745-2009)的学科分类和旅游文献中的具体研究内容进行整合和调整,共分为:旅游理论和研究、旅游地理、旅游策划及规划、旅游公共管理与行业管理、旅游教育、旅游道路与交通、旅游环境、旅游心理、旅游营销、旅游信息化及应用、旅游法、旅游人文、旅游经济、目的地和区域旅游发展、其他等共15大类,在大类下设90个二级分类和120个三级分类。
四、结果与简析
通过检索近十年(2003~2012年)的中文核心期刊数据库、CSSCI数据库、CSCD数据库,并按前述的方法经处理加工得到论文样本数为16024篇;期刊样本数为784种;作者样本数为13608人;作者单位2565家。平均每本期刊载旅游学术论文20.44篇,平均每位作者撰写1.18篇论文,平均每家机构5.03位作者。这是我国近十年旅游学术共同体的一些总体特征和基本状况。由于这些因子是呈长尾分布的,总量和均值无法揭示其内在的样本结构和优势样本的形态特征。
1.刊载旅游学术论文的期刊排序
在784种来源期刊中,按照载文数量和旅游论文所占全部论文的比例列出前100本学术期刊(表1)。
这100种期刊占期刊总样本的12.76%,刊载的论文数12124篇,占全部旅游论文样本的75.66%。列在前10位的,除《旅游学刊》和《旅游科学》外,地理类刊物4种,经济类和商业类各2种。从学科结构看,地理学在旅游学术研究贡献最大,在100种期刊中地理学的刊物达18种,其中还包括地理学界的权威刊物《地理学报》,以及所有较具影响力的地理学期刊。其次,经济学类也有18种之多,但这些期刊在经济学界学术地位不像地理学这样显赫。相比较而言,在教育部学科分类中,旅游管理虽作为管理学门类下的分支学科,但管理类的学术期刊仅有3种,且《管理世界》、《管理学报》、《南开管理评论》等著名学术期刊榜上无名。
2.旅游院校和科研机构排序
对2565家单位的作者应用上述介绍的评价和计分方法,列出前100家旅游院校和科研机构(表2)。表2中所称的旅游院校和科研机构系指设有旅游系科(或专业方向)和研究旅游的科研院所(或非实体研究中心)的教学科研机构,得分值与频次值之间差距程度说明作者所在单位的团队中与外部单位合作发表论文的程度。根据每个机构的得分利用自然间断分类法(natural break)将前100名的旅游院校和科研机构进行分级,由高到低依次划分为AAAAA级至A级,共分5个等级,阈值区间分别为[39.33,65.17 ],[68.22,103.35],[108.82,162.20],[168.65,254.10],[293.70,431.72]。自然间断分类法是通过标识数据值之间的间断点,基于数值自身特征的自然分组分类方法,一般选取数值跳跃相对大的临界点。该方法保证每个级别组内各得分数差异最小化,组间得分数差异最大化。
由于统计的是2003~2012年期间的论文累计数,一些成立历史较短的单位在排序上会因此受到影响。如2008年6月才开始筹备成立的中国旅游研究院仅列在第82名。
从排列在前9位的单位看,全部都是地理学科背景,中国科学院的论文数达465篇,几乎涵盖了全国各省(市、区)的相关研究所(研究中心),但仅位于北京的中国科学院地理科学与资源研究所一家,发表的论文就有251篇,占到54%。这一结果与表1得出的结论互相印证,说明地理学对于旅游学科的贡献要大于其他相关学科。此外,还可以从表2中具体看出每个院校机构的重点研究领域和研究优势,以及在旅游学科各专业方向和研究领域内哪几所旅游院校和科研机构处于领先地位,也可以按照专业方向和专题列出排序,限于篇幅这里就不再展开论述。
将表2的机构以所在的城市为单位,将分值累加,可以得出全国前100所旅游院校和科研机构的城市分布图(图1),从这一分布图上,可以发现这些机构的地理分布密度,竟然与我国著名的人口地理学创始人胡焕庸1935年提出的人口密度分布线,即从黑龙江瑷珲(今黑河爱辉区)到云南腾冲的“胡焕庸线”高度吻合。这是偶然巧合,还是存在内在的逻辑关系?这一现象背后的深层原因有待于进一步的研究。
3.论文作者排序
论文作者是旅游学术共同体的核心,也是旅游学科可持续发展的基础。应用上述评价和计分方法,列出前100名作者(表3)。由于可能存在同名同姓的情况,已经对前100名的作者逐一进行了核实,排除了不同的作者论文汇集在同一姓名下的可能。
从表3中也同样可以发现,地理学对于旅游学科的重要贡献。在前10名的作者中,除了位列第5名的作者是管理学背景外,其余9名的学术背景都是地理学。此外,作者的得分值与频次值之间差值大的话,一般为学术(学科)带头人、博士生导师、基金项目主持人等,也就是本单位的学术骨干。将表3与表2对比可发现,在表2中名列前茅的单位,其研究团队成员在表3中不仅排名较为靠前,而且,进入前100名的人数也相对较多。从中可以窥见这些学术机构的整体实力、学术骨干和在全国的相对地位。与表2相似,也可以从表3中具体看出每位学者的重点研究领域和研究优势,以及在旅游学科各专业方向和研究领域内哪几位学者处于领先地位,也可以按照专业方向和专题列出排序。
4.旅游学术研究主题分类
为全面了解16024篇论文的选题分布情况,对所选的论文样本进行主题的聚类分类,分类方案主要参考《学科分类与代码》(GB/T 13745-2009)。通过标题、关键词和摘要等内容信息确定二级分类和三级分类,如果上述内容的信息不充分、不确切的话,则可通过对全文进行语义分析来确定(表4)。
从表4可以看出,在15个大类中,旅游地理的论文达3032篇,列第一。而且诸如在旅游策划及规划、目的地和区域旅游发展等类别,属于旅游地理学的应用领域,在其中发表论文的作者也大多是从事地理学研究的。总之,从表4可以看出近十年我国旅游学术研究的概貌。本研究收集到的数据也支持增加时间维度的研究,即可以对选题结构进行逐年研究,从而寻找出各选题之间此长彼消的演变规律,以及背后的成因,并利用大数据对未来走势进行预测和推论。受本文篇幅所限,这部分研究暂未涉及。
五、结论与讨论
本文借鉴大数据的全样本方法,研究了近十年来我国旅游学术共同体的现状和格局,得出了一些较之以前同类研究更全面、更系统的结论。与国外同类研究(大多是研究全球)相比,本文(仅研究一国)的文献样本数都较前者多出近十倍、作者样本数多出几十倍,期刊样本数更多出上百倍。但必须指出的是,论文数量只是衡量学术影响力和学术贡献度的一个侧面,论文的学术质量还与被引频次和下载量相关,本研究之所以没有考虑这些因素是为了保持与帕克等采取的研究方法相一致,以便于进行国际比较(限于篇幅本研究没有涉及)。
本文的不足之处是,在方法论上,只是借鉴了大数据中的全样本概念,数据来源也仅限于三大数据库,没有跨领域、多渠道地收集更多的相关数据,特别是动态数据。对于已获得的数据,未能进行充分有效的利用和数据挖掘,表1~表4中披露的数据以及他们之间的相关关系也还有进一步分析研究的空间。此外,数据采集的范围还不够多样,如没有采集作者的年龄(这对于研究学术梯队尤其重要)、性别、学历、职称、职务、博硕士生导师、海外留学经历、学科背景、工作经历、师承关系、基金项目、所获奖项等个人信息,也没有采集作者单位的人员规模、学术资源、学科重点、发展条件等相关信息,从而未能挖掘和发现更多更有价值的结论,也没有对全样本的学术论文进行一些专题或关键词的文本分析和数据挖掘,这也是本研究下一步工作的努力方向。
最后,必须说明的是,本文采用的评价和排序方法只是为了与帕克等的研究相对应,并不意味着没有可商榷之处。事实上,论文的数量只是衡量学术贡献的一部分,学术著作、会议论文、研究报告等也都应该成为衡量指标。乔噶南等和瑞安也持有类似的观点。所有这些都需要在更大的范围内采集海量半结构、非结构性数据,综合应用语义分析、模糊识别、文本分析等人工智能技术来寻求一种有效的算法方案。
致谢:感谢《旅游学刊》编辑部魏云洁协助制图。
[关键词]旅游;学术共同体;学术期刊;大数据;排序
[中图分类号]F59
[文献标识码]A
[文章编号]1002-5006(2013)10-0114-012
一、问题的提出
近十年是我国旅游业发展处于转型升级的时期,也是旅游研究的黄金十年。2011年,全国开设旅游系(专业)的普通高等院校已达1115所,而2002年仅407所,十年期间平均增长10.6%。而同期旅行社和星级饭店的数量年均增长率分别为7.4%和2.8%,旅游教学和学术研究的队伍不断壮大。2008年6月,国家旅游局成立了颇具规模的中国旅游研究院,表明了旅游行业最高管理部门也开始重视旅游学术研究。经过30多年的改革开放和旅游发展,我国旅游研究已经逐步走出早期理论研究滞后于行业实践的困境,呈现了理论研究指导行业实践,科学研究适度超前的良好态势,形成了以多学科和跨学科交叉融合的旅游学术研究个人与团队。一门学科的生存与发展必须有一批从事研究本学科领域的专家学者队伍,一批高质量的研究成果和一批以刊载旅游学术论文为主或经常刊载旅游学术论文的学术期刊,这些就是所谓的“学术共同体”。旅游学术共同体的形成和发展壮大是旅游研究可持续发展的基础和保障。
建设世界旅游强国是一个涉及全行业、全产业链和全社会的系统工程,需要旅游学术共同体的智力支持和科技支撑。学术期刊是学术成果交流的主要载体,学术论文是联系作者与期刊之间的纽带,也是反映学科发展水平的晴雨表。本研究以2003~2012年在国内学术期刊上发表的学术论文为研究对象,审视和评价近十年来我国旅游学术共同体的发展现状、结构特征、空间分布和分类评价。
二、文献综述
通过统计学术期刊上发表论文的作者简历(年龄、性别、学历、职称和工作单位等)、论文主题、关键词、学科归属等信息,来认识和评估某一学科的现状格局、存在的问题和发展趋势,是一种较为简易、直接、有效和常用的研究方法。在旅游学科,有不少学者做过类似的研究,其中以《旅游学刊》为单一研究样本的论文就为数不少:如赵幼芳通过对1990~1999年期间《旅游学刊》文献库的统计研究该刊的作者人群和研究旨趣;吴必虎等通过研究《旅游学刊》1986年创刊至1999年所载的全部论文来分析中国旅游学术研究的态势;曹诗图和胡书玲以《旅游学刊》为例,对我国旅游研究进行检视与反思;曾丽则从2000~2009年《旅游学刊》载文的统计来探究旅游学术研究的发展;董晓莉等通过对《旅游学刊》关键词的分析来解析中国旅游研究的知识体系。也有不少学者通过研究国际旅游权威学术期刊《旅游研究纪事》(Annals of TourismResearch)来认识国际旅游学术界的研究动态。如张立生通过《旅游研究纪事》文献来分析国外旅游学研究进展,吴宇华则以此来阐述国外旅游学科体系的建构;吴必虎、邢珏珏等通过对《旅游研究纪事》30年的文献统计,分别研究了旅游学学科树构建、时空特征分析以及旅游学分支学科相关性动态演化研究。朱竑等通过《旅游学刊》和《旅游研究纪事》文献比较来研究中外旅游研究的异同和趋向。
有的学者以多种相关的学术期刊作为研究样本,如汪德根等通过《地理学报》、《地理研究》、《地理科学》和《自然资源学报》研究近20年中国旅游地理学的发展历程,以及与之进行国内外旅游学术比较研究;张凌云等对我国4种旅游学术期刊的论文统计来分析中国旅游学术研究现状与发展趋势。
随着我国数字图书馆和学术文献数据库如中国知网(CNKI)、维普网(VIP)和万方数据(WanfangData)、中国学位论文库(CDDB)等不断丰富完善,使得文献资料收集和数据处理都变得更加便利和更有效率。刘人怀等以CSSCI收录的旅游研究文献来探讨我国旅游学学科发展;廉同辉等也同样应用CSSCI分析了2000~2010年我国旅游学科知识图谱;冯凌等基于期刊论文库研究了中国旅游学术研究30年的发展历程与内生规律;张薇等基于SCIE、SSCI和A&HCI国际三大检索文献研究了1998~2007年全球旅游研究进展;孙业红等利用国内外旅游类核心期刊论文数据库研究了2001~2012年中国旅游研究的国际影响力。类似地,刘庆余利用国家基金项目库研究20年来国家自然、社科基金旅游项目反映的学术态势,来总结中国旅游研究进展;朱峰等则通过国家自然、社会科学基金旅游类项目的分析,反思了旅游研究中存在的“去旅游化”现象。
此外,章锦河等研究了我国旅游类博士硕士学位论文,陈德广从我国旅游博士论文选题分布来研究我国旅游学科的发展,以及与北美旅游地理博士论文进行了比较研究;唐顺英利用博士学位论文库分析了近十年中国旅游类博士学位论文的选题和类型。一般而言,论文的学术价值与期刊的学术地位有着较大的关联性,大多数学者是利用学术期刊平台来研究论文。而兰超英和张凌云则是利用所载论文来研究我国旅游学术期刊影响力和影响因子。张凌云在线检索和整理的160种国际旅游学术期刊,其中英文期刊132种,其他语种27种(不包括中文期刊),并给出了35种英文主要旅游学术期刊的主编、主编工作单位以及出版方等信息,对其中的20种学术期刊选题方向进行了分类统计,研究我国学者利用《旅游研究纪事》和《旅游管理》进行国外研究综述和中外旅游比较研究的状况。 在国外,谢尔顿(Sheldon)、乔噶南等(Jogaratnam,et al.)分别分析了1980~1989年和1992~2001年学术机构对于《旅游研究纪事》、《旅行研究杂志》(Journal of Travel Research)和《旅游管理》(Tourism Management)等3本旅游学术期刊的论文贡献;瑞安(Ryan)以35种旅游、酒店管理、休闲和旅游文化等相关学术期刊上发表论文在线被点击的数量,对刊物和作者进行了排序;麦克切尔等(Mckwecher,et al.)研究了旅游与酒店管理类学术期刊的评价方法。近年来,国外同类研究中影响较大的是帕克等(Park,et al.)在《接待业与旅游研究杂志》(Journal of Hospitality and TourismResearch)发表的“新千年的第一个十年:酒店及旅游研究——根据6种杂志按照作者、大学和国家进行排序”,其成果已受到国际旅游学术界的普遍关注。
上述国内论文对于认识我国某一时期,某一方面的旅游学术研究概貌和基本特征具有很强的指导意义和参考价值。但是,由于旅游学科具有综合性、交叉和跨学科等特点,目前,旅游学科并没有发展成为一门相对独立的学科,而是寄生在其他学科中成为该学科的一个分支,缺乏母学科的归属。在高等教育系统中旅游归于管理学门类之下,在出版系统又将其归为地理类,如《旅游学刊》是与《人文地理》和《经济地理》划为同一类别,而在图书管理系统(中图法)中,旅游归入经济学门类。正是由于旅游学科的这一特性,使得上述研究涉及的样本数和样本框都受到了较大的局限。上述成果中样本数量最多的也只抽取了3000多篇论文(且研究的时间跨度为10年,平均每年不足300篇),少的只有几百篇,而抽样范围也主要集中在几本刊物上。事实上,旅游论文的分布具有类似于长尾理论(The Long Tail)的学科分散性,仅统计几本旅游或与旅游学科密切相关的学术期刊,无法全面认识和客观评价旅游学术共同体的学术成果和学科建设。
同样地,帕克等只是选取《接待业与旅游研究杂志》、《国际酒店管理杂志》(International Journal of Hospitality Management)、《康奈尔酒店季刊》(Cornell Hospitality Quarterly)、《旅游管理》、《旅游研究纪事》、《旅行研究杂志》等6本旅游学术期刊(共选取了10年期间发表的2834篇论文,平均每年283.4篇),来研究全球的旅游学术概貌,其结论难免以偏概全。目前,进入SSCI的旅游类(包括户外运动和休闲)学术期刊已经达到35种之多,而帕克等只是在酒店和旅游的学术刊物中各选取了3种,像《可持续旅游》(Journal of Sustainable Tourism)、《旅游地理学》(Tourism Geographies)、《旅游经济学》(Tourism Economics)等均未列入,更何况一些旅游学术论文是发表在地理学、管理学、经济学、社会学(民族学、人类学)、心理学、生态学等主流学术期刊上的。如英国学者巴勒特(Butler)关于旅游目的地生命周期理论的著名论文就是发表在《加拿大地理学家》(Canadian Geographer),一本影响力不大的非旅游学术期刊。又如以色列著名的旅游社会学家科恩(Cohen)一些有影响的论文大多发表在《社会学年度评论》(Annual Review of Sociology)、《社会学》(Sociology)和《社会学研究》(Social Research)等社会学主流刊物上。
三、方法与数据
衡量作者、大学和研究机构对学术研究的贡献一般采用的方法有:问卷调查、引文分析、内容分析和德菲尔法。但这些研究都是基于小数据的抽样调查。如前所述,旅游学科分别散布于各个学科门下,刊物名称中含旅游的寥寥无几,而进入北大核心期刊的仅《旅游学刊》一种,进入南大核心(CSSCI来源期刊)的也只有《旅游学刊》、《旅游科学》两种,以及南大核心扩展版的《旅游论坛》。这就意味着大量的旅游学术论文都是发表在非旅游刊物上的。兰超英等应用布拉福德分散定律(Bradford’s law of scattering),对中国期刊全文数据库(Chinese Journal Full-text Database)、维普和万方3个数据库中的6367种期刊刊载的80831篇论文进行了检索,确定了89种期刊为核心区刊物(但未剔除非中文核心期刊和非CSSCI来源期刊),并对核心区期刊的载文量、被引频次、下载频次和影响因子进行测量和评价。尽管89种期刊数量已经较之以往的研究放大了许多倍,但从方法论上看,仍属于小数据的抽样。事实上,旅游学科的论文分布非常类似于安德森(Anderson)提出的长尾理论。因此,本研究尝试大数据(big data)的方法,让数据说话,通过更多和更杂的数据,达到更好的效果。具体地说,大数据遵循以下3个原则:1)利用所有的数据,而不再仅仅依靠一小部分数据,全数据模式就是,样本=总体;2)允许数据的混杂性,不苛求精确性;3)不强调因果关系,而是看重相关关系。
综上,本文采用全样本的研究方法。在中文核心期刊数据库、CSSCI数据库(不计扩展版)、CSCD数据库中分别设计了25组字段进行“题名”或“关键词”进行检索(时间跨度为2003~2012年),共得出74497篇文献。对这些文献再从“作者、年份、标题、期刊”等多个方面对各数据内部和各数据之间跨库进行查重,并经删除发表在增刊上的文献,以及会议通知、会议报道、专访、征稿启事、广告等非学术性文章,论文数量还剩下20895篇。最后,再根据出刊周期,剔除旬刊、周刊和半月刊等出版周期较短的刊物,得到论文样本数为16024篇。
为了使本研究的成果便于国际比较,在评价和计分时,采用帕克等的标准和口径。1)作者评价和计分:假设一篇文章有Ⅳ个作者,则每个作者的得分为1/N,将该作者每篇文章的得分相加即得“总分”,按作者出现的频次统计“文章总数”(作者现任职为2013年8月通过各作者机构官方网站查询得出);2)作者单位的处理:仅计一级学校和单位,分校、二级学院及下属部门均纳入一级范围内。假设一篇文章有Ⅳ个作者,某一作者分属M个作者单位,则该文章下属的每个作者单位得分为1/NM。频次N指某一单位在Ⅳ篇文章中出现过。 目前,旅游学科的分类归属在旅游学术界内还存在着不同的意见。此外,学术界和出版界对于旅游学科的分类差异更大。本研究采取国家标准《学科分类与代码》(GB/T 13745-2009)的学科分类和旅游文献中的具体研究内容进行整合和调整,共分为:旅游理论和研究、旅游地理、旅游策划及规划、旅游公共管理与行业管理、旅游教育、旅游道路与交通、旅游环境、旅游心理、旅游营销、旅游信息化及应用、旅游法、旅游人文、旅游经济、目的地和区域旅游发展、其他等共15大类,在大类下设90个二级分类和120个三级分类。
四、结果与简析
通过检索近十年(2003~2012年)的中文核心期刊数据库、CSSCI数据库、CSCD数据库,并按前述的方法经处理加工得到论文样本数为16024篇;期刊样本数为784种;作者样本数为13608人;作者单位2565家。平均每本期刊载旅游学术论文20.44篇,平均每位作者撰写1.18篇论文,平均每家机构5.03位作者。这是我国近十年旅游学术共同体的一些总体特征和基本状况。由于这些因子是呈长尾分布的,总量和均值无法揭示其内在的样本结构和优势样本的形态特征。
1.刊载旅游学术论文的期刊排序
在784种来源期刊中,按照载文数量和旅游论文所占全部论文的比例列出前100本学术期刊(表1)。
这100种期刊占期刊总样本的12.76%,刊载的论文数12124篇,占全部旅游论文样本的75.66%。列在前10位的,除《旅游学刊》和《旅游科学》外,地理类刊物4种,经济类和商业类各2种。从学科结构看,地理学在旅游学术研究贡献最大,在100种期刊中地理学的刊物达18种,其中还包括地理学界的权威刊物《地理学报》,以及所有较具影响力的地理学期刊。其次,经济学类也有18种之多,但这些期刊在经济学界学术地位不像地理学这样显赫。相比较而言,在教育部学科分类中,旅游管理虽作为管理学门类下的分支学科,但管理类的学术期刊仅有3种,且《管理世界》、《管理学报》、《南开管理评论》等著名学术期刊榜上无名。
2.旅游院校和科研机构排序
对2565家单位的作者应用上述介绍的评价和计分方法,列出前100家旅游院校和科研机构(表2)。表2中所称的旅游院校和科研机构系指设有旅游系科(或专业方向)和研究旅游的科研院所(或非实体研究中心)的教学科研机构,得分值与频次值之间差距程度说明作者所在单位的团队中与外部单位合作发表论文的程度。根据每个机构的得分利用自然间断分类法(natural break)将前100名的旅游院校和科研机构进行分级,由高到低依次划分为AAAAA级至A级,共分5个等级,阈值区间分别为[39.33,65.17 ],[68.22,103.35],[108.82,162.20],[168.65,254.10],[293.70,431.72]。自然间断分类法是通过标识数据值之间的间断点,基于数值自身特征的自然分组分类方法,一般选取数值跳跃相对大的临界点。该方法保证每个级别组内各得分数差异最小化,组间得分数差异最大化。
由于统计的是2003~2012年期间的论文累计数,一些成立历史较短的单位在排序上会因此受到影响。如2008年6月才开始筹备成立的中国旅游研究院仅列在第82名。
从排列在前9位的单位看,全部都是地理学科背景,中国科学院的论文数达465篇,几乎涵盖了全国各省(市、区)的相关研究所(研究中心),但仅位于北京的中国科学院地理科学与资源研究所一家,发表的论文就有251篇,占到54%。这一结果与表1得出的结论互相印证,说明地理学对于旅游学科的贡献要大于其他相关学科。此外,还可以从表2中具体看出每个院校机构的重点研究领域和研究优势,以及在旅游学科各专业方向和研究领域内哪几所旅游院校和科研机构处于领先地位,也可以按照专业方向和专题列出排序,限于篇幅这里就不再展开论述。
将表2的机构以所在的城市为单位,将分值累加,可以得出全国前100所旅游院校和科研机构的城市分布图(图1),从这一分布图上,可以发现这些机构的地理分布密度,竟然与我国著名的人口地理学创始人胡焕庸1935年提出的人口密度分布线,即从黑龙江瑷珲(今黑河爱辉区)到云南腾冲的“胡焕庸线”高度吻合。这是偶然巧合,还是存在内在的逻辑关系?这一现象背后的深层原因有待于进一步的研究。
3.论文作者排序
论文作者是旅游学术共同体的核心,也是旅游学科可持续发展的基础。应用上述评价和计分方法,列出前100名作者(表3)。由于可能存在同名同姓的情况,已经对前100名的作者逐一进行了核实,排除了不同的作者论文汇集在同一姓名下的可能。
从表3中也同样可以发现,地理学对于旅游学科的重要贡献。在前10名的作者中,除了位列第5名的作者是管理学背景外,其余9名的学术背景都是地理学。此外,作者的得分值与频次值之间差值大的话,一般为学术(学科)带头人、博士生导师、基金项目主持人等,也就是本单位的学术骨干。将表3与表2对比可发现,在表2中名列前茅的单位,其研究团队成员在表3中不仅排名较为靠前,而且,进入前100名的人数也相对较多。从中可以窥见这些学术机构的整体实力、学术骨干和在全国的相对地位。与表2相似,也可以从表3中具体看出每位学者的重点研究领域和研究优势,以及在旅游学科各专业方向和研究领域内哪几位学者处于领先地位,也可以按照专业方向和专题列出排序。
4.旅游学术研究主题分类
为全面了解16024篇论文的选题分布情况,对所选的论文样本进行主题的聚类分类,分类方案主要参考《学科分类与代码》(GB/T 13745-2009)。通过标题、关键词和摘要等内容信息确定二级分类和三级分类,如果上述内容的信息不充分、不确切的话,则可通过对全文进行语义分析来确定(表4)。
从表4可以看出,在15个大类中,旅游地理的论文达3032篇,列第一。而且诸如在旅游策划及规划、目的地和区域旅游发展等类别,属于旅游地理学的应用领域,在其中发表论文的作者也大多是从事地理学研究的。总之,从表4可以看出近十年我国旅游学术研究的概貌。本研究收集到的数据也支持增加时间维度的研究,即可以对选题结构进行逐年研究,从而寻找出各选题之间此长彼消的演变规律,以及背后的成因,并利用大数据对未来走势进行预测和推论。受本文篇幅所限,这部分研究暂未涉及。
五、结论与讨论
本文借鉴大数据的全样本方法,研究了近十年来我国旅游学术共同体的现状和格局,得出了一些较之以前同类研究更全面、更系统的结论。与国外同类研究(大多是研究全球)相比,本文(仅研究一国)的文献样本数都较前者多出近十倍、作者样本数多出几十倍,期刊样本数更多出上百倍。但必须指出的是,论文数量只是衡量学术影响力和学术贡献度的一个侧面,论文的学术质量还与被引频次和下载量相关,本研究之所以没有考虑这些因素是为了保持与帕克等采取的研究方法相一致,以便于进行国际比较(限于篇幅本研究没有涉及)。
本文的不足之处是,在方法论上,只是借鉴了大数据中的全样本概念,数据来源也仅限于三大数据库,没有跨领域、多渠道地收集更多的相关数据,特别是动态数据。对于已获得的数据,未能进行充分有效的利用和数据挖掘,表1~表4中披露的数据以及他们之间的相关关系也还有进一步分析研究的空间。此外,数据采集的范围还不够多样,如没有采集作者的年龄(这对于研究学术梯队尤其重要)、性别、学历、职称、职务、博硕士生导师、海外留学经历、学科背景、工作经历、师承关系、基金项目、所获奖项等个人信息,也没有采集作者单位的人员规模、学术资源、学科重点、发展条件等相关信息,从而未能挖掘和发现更多更有价值的结论,也没有对全样本的学术论文进行一些专题或关键词的文本分析和数据挖掘,这也是本研究下一步工作的努力方向。
最后,必须说明的是,本文采用的评价和排序方法只是为了与帕克等的研究相对应,并不意味着没有可商榷之处。事实上,论文的数量只是衡量学术贡献的一部分,学术著作、会议论文、研究报告等也都应该成为衡量指标。乔噶南等和瑞安也持有类似的观点。所有这些都需要在更大的范围内采集海量半结构、非结构性数据,综合应用语义分析、模糊识别、文本分析等人工智能技术来寻求一种有效的算法方案。
致谢:感谢《旅游学刊》编辑部魏云洁协助制图。