论文部分内容阅读
摘要:当今,我国国民的有声阅读率持续上升,越来越多的人选择有声阅读的方式来获取知识与信息,以喜马拉雅FM为代表的在线音频分享平台因资源丰富、获取方式便捷受到用户的追捧。随着近年来“国学”升温,“国学”和优秀传统文化类有声读物的平台播放量也在逐年提升。本文通过数据的挖掘与处理,对该平台国学有声读物的选题、受众以及内容质量进行分析,并据此提出有针对性的建议。
关键词:传统文化 有声阅读 有声读物 数据挖掘
自文字诞生起,声音就与其有着密不可分的联系,“声音”在文本与阅读之间发挥着重要的作用。例如在古希腊,受书本的昂贵性与识字率普遍低下的限制,“聆听”才是那时候人们最重要的阅读手段。[1]随着数字阅读时代的到来,人们的阅读行为发生了巨大变化,“读声”的阅读方式越来越受到欢迎。以有声阅读为例,由中国新闻出版研究院组织实施的“全国国民阅读调查”于2018年发布的第十四次报告中首次提及有声阅读,认为有声阅读已成为国民阅读新的增长点;该院最新的调查报告显示,2020年,我国有31.6%的成年国民有听书习惯,较2019年的平均水平(30.3%)提高了1.3个百分点。对我国成年国民听书介质的考察发现,选择“移动有声APP平台”听书的国民比例较高,为17.5%;有10.8%的人选择通过“微信公众号或小程序”听书;有10.4%的人选择通过“智能音箱”听书;分别有8.8%和5.5%的人选择通过“广播”和“有声阅读器或语音读书机”听书。[2]
所谓“有声读物”,就是“以磁带、光盘、移动数字终端和其他音频方式为载体,以文字内容为主体,能够通过下载、在线等多种形式播放收听的录音制品。”[3]随着有声阅读用户规模的扩大,各种在线有声阅读平台相继涌现,为用户提供了丰富多样的内容供给。其中,以“国学”为代表的传统文化及相关内容尤其引人瞩目。在线有声阅读已经成为弘扬传统文化的重要传播方式之一。麦克卢汉曾指出中国人是“听觉人”,中国传统文化对听觉存在传播路径依赖。[4]余园园认为,我国听书的传统奠定了“听”这一形式在阅读接受度上的优势,并且促使部分文化典籍在创作的过程中追求听觉上的美感,从而使传统文化具有听觉美的特质。[5]由此可见,有声阅读在文化传承中有着重要作用,是一种已被研究证明的优秀传统文化传播和传承的有效途径。
笔者以在线有声平台市场占有率第一的“喜马拉雅FM”为例,搜集该平台下与国学相关的高播放量专辑样本,通过挖掘与分析这些专辑的标题、标签以及用户评论数据,来对其各项质量特征进行定量化研究。
研究设计
喜马拉雅FM的检索系统提供搜索词的智能关联功能,以“国学”为关键词检索,可搜索到同时包括标题、标签中无明确“国学”字样的中华传统文化相关专辑近5万张,头部专辑的播放量高达4亿,可见,无论是生产者还是受众对于国学都有着十分浓厚的兴趣。喜马拉雅FM提供的主要音频内容来源于广大普通用户参与创作并分享的网络音频,即所谓的UGC(用户生产内容)音频。与PGC(专业生产内容)音频相比,很多UGC音频的随意性很强。用户的异质性与无责任性一方面使UGC音频包罗万象,另一方面也必然导致其质量良莠不齐。[6]当前,国内对于UGC有声读物质量建设的相关研究较少,主要集中在:受众倾向于收听哪些国学内容?受众是哪些年龄段?什么因素影响受众喜爱或者不喜爱某张专辑?笔者尝试通过优质样本提取、数据挖掘和文本分析等方式对以上问题作出解答。
笔者对上述检索到的专辑依照播放量进行排序,取前1000张专辑,利用爬虫技术采集这1000张专辑的标题、标签、评论数据,经过数据清洗滤除空白、无效的数据后,再利用“GooSeeker中文分词软件”进行智能分词、人工筛选、同义词合并,并使用百度AI开放平台的情感倾向分析API接口进行文本情感倾向分析,得到一系列相关数据,从而对喜马拉雅FM国学有声读物的选题、受众以及内容质量进行研究并得出相关结论和建议。
国学有声读物选材、受众和用户评价数据分析
选材主题分析。“国学”概念涵蓋面广泛,包括文史哲等不同主题都可能被喜马拉雅FM标注为“国学”,而几乎所有生产者都在标题中体现了该专辑所选择进行诵读或赏析的国学材料。本研究在获得高播放量专辑下,根据不同主题的出现次数与播放量,确定作者与受众喜爱的国学内容。
在初步的分词操作完成后,需通过人工判定、筛选与专辑所选材料相关的词汇。在这一步中,例如“易经”“三字经”“论语”“红楼梦”等词汇被初步筛选出来,并按照词频高低依次进行排列。不过,此时得到的数据较为零散且会出现词义包含的现象。
聚类后得到了21个选材主题。由数据可以得出,累计出现频次最多的前十个选材主题分别是五经(22.07%)>蒙学(18.10%)>诗文(9.19%)>四书(7.64%)>道家(7.21%)>小说(6.65%)>术数(6.51%)>断代史(3.68%)>医家(3.67%)>儒家(3.54%)。而累计播放量最多的前十个选材主题分别是蒙学(27.80%)>诗文(20.78%)>道家(15.46%)>五经(9.81%)>小说(9.36%)>术数(4.24%)>医家(2.71%)>四书(2.16%)>断代史(1.87%)>儒家(1.29%)。
若对“断代史”按照时序进一步细分,以“上古”(公元3世纪以前,先秦两汉)、“中古”(公元3世纪至16世纪,魏晋至明中叶)与“近古”(公元16世纪至20世纪初期,明中叶至“五四”运动)三个时间段进行划分统计,可得出现频次中的占比分别为中古(59%)>上古(27%)>近古(14%),而播放量的占比分别为中古(69%)>近古(17%)>上古(14%)。值得一提的是,在样本中作为中国近古主要朝代的元史、明史都有所缺失,是作者没有创作出足够优质的音频内容吸引读者,还是读者群体对于这两个朝代的历史并不感兴趣?从元明史通俗读物的畅销程度来看,后者的可能性非常小。说明该领域有开发的潜力,值得历史领域的生产者关注。 从统计结果可以粗略看出,专辑作者喜爱选择的题材与受众喜爱收听的内容之间似乎存在一些差异,最为明显的是“四书”与“五经”,它们在累计出现频次中的排名都进入了前四;然而在累计播放量方面却表现平平,两者合计仅占11.97%。与之相对应的,在累计出现频次中仅占9.19%与7.21%的“诗文”“道家”却在累计播放量中分别占20.78%与15.46%,专辑数量虽然不多,播放量却名列前茅。
为了验证上面的结论,并分析两者之间的差异程度,笔者对累计出现频次与累计播放量这两份数据进行了线性回归分析。取全体21个选材主题进行计算,两者间的相关系数为0.75(置信度99.99%),若只挑选累计播放量前十的数据进行计算,它们之间的相关系数仅为0.59(置信度93.8%)。这表明,某个选材主题的播放量与其出现频次与之间有着一定的正相关关系,但这种正相关的强度为弱至中等,这说明有一部分出现频次较高的选材主题确实能获得与之相应的高播放量。在累计播放量位列前十的主题区间段中更是如此。在该区间段中,有近一半的高出现频次主题并不如预期,出现频次较少的主题却意外地能够获取高播放量,这代表着有一部分的受众并不满足于生产者大量提供的内容,反而是一些相较小众、制作不多的题材更受这些受众青睐,这个现象值得关注。
受众人群分析。研究发现,喜马拉雅FM平台的不少专辑会在标签栏中标注该专辑针对的受众人群。通过对一千张专辑标签栏的数据采集与分词分析,得到受众标签638条,去重后(有些专辑会同时标注多个相同的受众标签),可知有534张专辑标注了受众。在对受众标签进行人工筛出后,发现所有的受众标签无一例外都与青少年和儿童有关,全年龄受众的专辑通常不会特别标注“全年龄”相关字样,多是直接与主题相关的标签;而提供给青少年和儿童的国学专辑却非常乐于使用标签标注自己的受众,以便家长挑选合适自己孩子年龄段的国学专辑。虽然以青少年和儿童为受众的专辑从数量上来看仅占总体的一半左右,但考慮到受众划分存在年龄分布不均衡的情况,青少年和儿童可以被视为受众的主力军。
若以青少年和儿童年龄阶段的关键词划分进行同义词合并操作,例如将类似于“蒙学”“宝宝”等标签关键词全部划分入“启蒙”中,可进一步细分出标明受众专辑的青少年和儿童年龄层次。其中,“启蒙”定义为0—6岁的学龄前孩童,“少儿”定义为7—12岁学龄期儿童,“青少年”定义为13—18岁的未成年人。
按以上规则划分统计后可以得知,少儿是其中占比最大的受众年龄层次,遥遥领先于其他两个年龄层次,占74%;启蒙占23%,接近1/4,是不容忽视的差异化受众群体;青少年是占比最少的受众群体,仅占3%,几乎可以忽略不计。
受众评论分析。喜马拉雅FM平台的专辑评论区主要由“评论正文”“打分”与“评论的回复”三部分组成,评论直观地反映了受众对于国学有声读物专辑的态度,以及他们对于专辑的关注点。笔者挑选1000张专辑中播放量前10%的优质专辑,对“评论正文”和“打分”这两个部分的数据进行采集,初步得到打分为1—10分的所有评论和部分未打分的所有评论。
首先,评论情感倾向分析。共得到28357条积极评论、856条消极评论和少量没有明确态度的中性评论。总体来看,由于播放量较高的专辑总体素质较为优质,积极评论的数量远远大于消极评论的数量,用户对于优质国学专辑的综合评价是比较积极的。
其次,消极评论分析。要对评论中分词筛选得出的关键词进行分析,首先需要确定一个划分关键词的分类指标。笔者使用迟雨晴提出的“数字有声读物内容质量评价因素”[7]中的一级指标进行大类的划分。该评价因素一级指标分别有选题质量、知识质量、播读质量、录音质量、后期质量,每个指标对应的关键词如表2所示,关键词由消极评论分词筛选后的高频相关词汇(出现频次≥1)组成。由于关键词过多,表中指标只展示部分典型词汇。
按以上规则统计得出消极评论质量评价指标占比:知识质量(50%)>选题质量(21%)>录音质量(13%)>播读质量(9%)>后期质量(7%)。从数据可以得知,有关知识质量方面的消极评论占到评论总量的一半以上,录音质量、播读质量、后期质量等因素占比较为接近,共占29%。可见,导致受众消极评价的因素主要还是在于专辑的内涵(选题与知识)有所欠缺;同时对表现形式(播读、录音与后期)亦有关注,但占比较小。
最后,积极评论分析。与消极关键词对比可以发现,由于数据量的增加,各指标中对应关键词数量和维度丰富程度都有提升,特别是“播读质量”指标下的增加尤为明显。
按以上规则统计得到的积极评论的质量评价指标占比:知识质量(38%)>播读质量(24%)>选题质量(24%)>录音质量(11%)>后期质量(3%)。与消极评论对比看出,播读质量因素和选题质量的占比都有所增加,各占24%。在积极评论中,受众对专辑表现形式(播读、录音与后期)的关注增加,占38%。虽仍低于专辑的内涵(选题与知识),但表现形式因素的占比相较于消极评论中有了显著增加,在增进受众的满意度方面有着积极作用。
思考与建议
根据对喜马拉雅FM国学类有声读物选材主题、受众群体、用户评价的数据分析可以发现:生产者大量提供的内容并不一定能获取相应的高播放量;青少年与儿童是国学有声专辑的主力受众;专辑内涵的缺失是受众产生负面评价的主要原因,而表现形式的精彩丰富会更多地增加受众对于某张专辑的满意度。下面,就将对产生上述现象的原因进行分析,并提出针对性建议。
一是要注意选材的“边际收益递减”现象,积极开辟新内容、新形式吸引受众。如前文所述,专辑作者喜爱选择的题材与受众喜爱收听的内容之间存在一些差异,生产者大量提供的内容并不一定能获取相应的高播放量,笔者认为“边际收益递减规律”能够解释这一现象。当同一个内容之下的专辑达到饱和时,由于同种内容的受众数量是有限的,继续制作这种选材的专辑会受到边际收益递减规律的限制,即使这个专辑可能内容足够优质,实际播放量增量还是会不可避免地下降。作者要积极开发新的内容和新的表现形式,从而挖掘更多潜在受众,避免边际收益递减效应。对于受众而言,合理匹配的知识供需结构能够避免过量、重复的信息所导致的“信息过载”现象。 二是平台与作者要通力合作,开发针对更多不同年龄层次群体的国学有声内容。结果显示,青少年和儿童是高质量国学有声专辑的主要受众。而在实际生活中大部分青少年儿童,特别是低龄儿童群体,缺乏在互联网上主动搜索偏好内容收听的能力与认知力,因此可以认为这些内容多为家长特意挑选并播放的,从各种带有“给孩子的”字样的专辑标题、标签以及蒙学相关选材的受欢迎程度中可见端倪。高质量的国学内容应该能让所有人都受益,因此,首先应该通过生产者与平台的配合,打破这种刻板印象。例如可以让生产者制作相关问卷,通过平台有针对性地分发,对成年受众群体的喜好进行全面调查,制作出根据用户群体特征分层的优质内容,再通过平台配合用户大数据进行精准的个性化推荐与宣传,让更多受众能接触到与之相对应的优质国学有声内容,从而拓展受众的年龄层次。
三是制作优秀国学有声专辑,需把握住内容质量的“保健因素”與“激励因素”。“保健因素”与“激励因素”的概念来源于美国心理学家赫兹伯格的“双因素激励理论”。该理论最初在人力资源管理领域得到应用,其后被不少学者借鉴并应用于对用户激励的研究。因此,在制作国学有声专辑时确保选题适宜以及知识含金量高是第一要务,这可以被看作“保健因素”的部分。想要做好国学有声读物,不在表达方式下功夫是不行的。特别重要的是主播的素质,口齿清晰、语言组织能力强、讲述方式得体等特质可以为一个有声专辑大大加分,是获得受众好评的关键,在积极评论之中的比例相较于消极评论有着显著的提升,因此可以认为这些质量因素是一种“激励因素”。
作者温恺宁系上海大学图书情报档案系2020级硕士研究生,熊静系上海大学图书情报档案系副教授、硕士研究生导师
参考文献
[1] 栗月静. 阅读的历史:从朗读到默读[J]. 教师博览, 2012(12):54-56.
[2] 中国新闻出版研究院全国国民阅读调查课题组. 第十八次全国国民阅读调查主要发现[J]. 新阅读, 2021(5):7-9.
[3] 蔡翔, 王睿. 从国民听书率看我国有声阅读产业发展趋势[J]. 现代出版, 2018(1):65-70.
[4] 傅修延. 为什么麦克卢汉说中国人是“听觉人”——中国文化的听觉传统及其对叙事的影响[J]. 文学评论, 2016(1):135-144.
[5] 余园园. 碎片化阅读时代有声书弘扬传统文化研究——以喜马拉雅FM为例[D]. 南昌: 南昌大学, 2019.
[6] 陈峥. 不平行的空间:用户生成内容大数据质量探析[J]. 图书馆, 2021(3):90-98.
[7] 迟雨晴. 我国数字有声读物内容质量问题研究[D]. 南京: 南京大学, 2020.
关键词:传统文化 有声阅读 有声读物 数据挖掘
自文字诞生起,声音就与其有着密不可分的联系,“声音”在文本与阅读之间发挥着重要的作用。例如在古希腊,受书本的昂贵性与识字率普遍低下的限制,“聆听”才是那时候人们最重要的阅读手段。[1]随着数字阅读时代的到来,人们的阅读行为发生了巨大变化,“读声”的阅读方式越来越受到欢迎。以有声阅读为例,由中国新闻出版研究院组织实施的“全国国民阅读调查”于2018年发布的第十四次报告中首次提及有声阅读,认为有声阅读已成为国民阅读新的增长点;该院最新的调查报告显示,2020年,我国有31.6%的成年国民有听书习惯,较2019年的平均水平(30.3%)提高了1.3个百分点。对我国成年国民听书介质的考察发现,选择“移动有声APP平台”听书的国民比例较高,为17.5%;有10.8%的人选择通过“微信公众号或小程序”听书;有10.4%的人选择通过“智能音箱”听书;分别有8.8%和5.5%的人选择通过“广播”和“有声阅读器或语音读书机”听书。[2]
所谓“有声读物”,就是“以磁带、光盘、移动数字终端和其他音频方式为载体,以文字内容为主体,能够通过下载、在线等多种形式播放收听的录音制品。”[3]随着有声阅读用户规模的扩大,各种在线有声阅读平台相继涌现,为用户提供了丰富多样的内容供给。其中,以“国学”为代表的传统文化及相关内容尤其引人瞩目。在线有声阅读已经成为弘扬传统文化的重要传播方式之一。麦克卢汉曾指出中国人是“听觉人”,中国传统文化对听觉存在传播路径依赖。[4]余园园认为,我国听书的传统奠定了“听”这一形式在阅读接受度上的优势,并且促使部分文化典籍在创作的过程中追求听觉上的美感,从而使传统文化具有听觉美的特质。[5]由此可见,有声阅读在文化传承中有着重要作用,是一种已被研究证明的优秀传统文化传播和传承的有效途径。
笔者以在线有声平台市场占有率第一的“喜马拉雅FM”为例,搜集该平台下与国学相关的高播放量专辑样本,通过挖掘与分析这些专辑的标题、标签以及用户评论数据,来对其各项质量特征进行定量化研究。
研究设计
喜马拉雅FM的检索系统提供搜索词的智能关联功能,以“国学”为关键词检索,可搜索到同时包括标题、标签中无明确“国学”字样的中华传统文化相关专辑近5万张,头部专辑的播放量高达4亿,可见,无论是生产者还是受众对于国学都有着十分浓厚的兴趣。喜马拉雅FM提供的主要音频内容来源于广大普通用户参与创作并分享的网络音频,即所谓的UGC(用户生产内容)音频。与PGC(专业生产内容)音频相比,很多UGC音频的随意性很强。用户的异质性与无责任性一方面使UGC音频包罗万象,另一方面也必然导致其质量良莠不齐。[6]当前,国内对于UGC有声读物质量建设的相关研究较少,主要集中在:受众倾向于收听哪些国学内容?受众是哪些年龄段?什么因素影响受众喜爱或者不喜爱某张专辑?笔者尝试通过优质样本提取、数据挖掘和文本分析等方式对以上问题作出解答。
笔者对上述检索到的专辑依照播放量进行排序,取前1000张专辑,利用爬虫技术采集这1000张专辑的标题、标签、评论数据,经过数据清洗滤除空白、无效的数据后,再利用“GooSeeker中文分词软件”进行智能分词、人工筛选、同义词合并,并使用百度AI开放平台的情感倾向分析API接口进行文本情感倾向分析,得到一系列相关数据,从而对喜马拉雅FM国学有声读物的选题、受众以及内容质量进行研究并得出相关结论和建议。
国学有声读物选材、受众和用户评价数据分析
选材主题分析。“国学”概念涵蓋面广泛,包括文史哲等不同主题都可能被喜马拉雅FM标注为“国学”,而几乎所有生产者都在标题中体现了该专辑所选择进行诵读或赏析的国学材料。本研究在获得高播放量专辑下,根据不同主题的出现次数与播放量,确定作者与受众喜爱的国学内容。
在初步的分词操作完成后,需通过人工判定、筛选与专辑所选材料相关的词汇。在这一步中,例如“易经”“三字经”“论语”“红楼梦”等词汇被初步筛选出来,并按照词频高低依次进行排列。不过,此时得到的数据较为零散且会出现词义包含的现象。
聚类后得到了21个选材主题。由数据可以得出,累计出现频次最多的前十个选材主题分别是五经(22.07%)>蒙学(18.10%)>诗文(9.19%)>四书(7.64%)>道家(7.21%)>小说(6.65%)>术数(6.51%)>断代史(3.68%)>医家(3.67%)>儒家(3.54%)。而累计播放量最多的前十个选材主题分别是蒙学(27.80%)>诗文(20.78%)>道家(15.46%)>五经(9.81%)>小说(9.36%)>术数(4.24%)>医家(2.71%)>四书(2.16%)>断代史(1.87%)>儒家(1.29%)。
若对“断代史”按照时序进一步细分,以“上古”(公元3世纪以前,先秦两汉)、“中古”(公元3世纪至16世纪,魏晋至明中叶)与“近古”(公元16世纪至20世纪初期,明中叶至“五四”运动)三个时间段进行划分统计,可得出现频次中的占比分别为中古(59%)>上古(27%)>近古(14%),而播放量的占比分别为中古(69%)>近古(17%)>上古(14%)。值得一提的是,在样本中作为中国近古主要朝代的元史、明史都有所缺失,是作者没有创作出足够优质的音频内容吸引读者,还是读者群体对于这两个朝代的历史并不感兴趣?从元明史通俗读物的畅销程度来看,后者的可能性非常小。说明该领域有开发的潜力,值得历史领域的生产者关注。 从统计结果可以粗略看出,专辑作者喜爱选择的题材与受众喜爱收听的内容之间似乎存在一些差异,最为明显的是“四书”与“五经”,它们在累计出现频次中的排名都进入了前四;然而在累计播放量方面却表现平平,两者合计仅占11.97%。与之相对应的,在累计出现频次中仅占9.19%与7.21%的“诗文”“道家”却在累计播放量中分别占20.78%与15.46%,专辑数量虽然不多,播放量却名列前茅。
为了验证上面的结论,并分析两者之间的差异程度,笔者对累计出现频次与累计播放量这两份数据进行了线性回归分析。取全体21个选材主题进行计算,两者间的相关系数为0.75(置信度99.99%),若只挑选累计播放量前十的数据进行计算,它们之间的相关系数仅为0.59(置信度93.8%)。这表明,某个选材主题的播放量与其出现频次与之间有着一定的正相关关系,但这种正相关的强度为弱至中等,这说明有一部分出现频次较高的选材主题确实能获得与之相应的高播放量。在累计播放量位列前十的主题区间段中更是如此。在该区间段中,有近一半的高出现频次主题并不如预期,出现频次较少的主题却意外地能够获取高播放量,这代表着有一部分的受众并不满足于生产者大量提供的内容,反而是一些相较小众、制作不多的题材更受这些受众青睐,这个现象值得关注。
受众人群分析。研究发现,喜马拉雅FM平台的不少专辑会在标签栏中标注该专辑针对的受众人群。通过对一千张专辑标签栏的数据采集与分词分析,得到受众标签638条,去重后(有些专辑会同时标注多个相同的受众标签),可知有534张专辑标注了受众。在对受众标签进行人工筛出后,发现所有的受众标签无一例外都与青少年和儿童有关,全年龄受众的专辑通常不会特别标注“全年龄”相关字样,多是直接与主题相关的标签;而提供给青少年和儿童的国学专辑却非常乐于使用标签标注自己的受众,以便家长挑选合适自己孩子年龄段的国学专辑。虽然以青少年和儿童为受众的专辑从数量上来看仅占总体的一半左右,但考慮到受众划分存在年龄分布不均衡的情况,青少年和儿童可以被视为受众的主力军。
若以青少年和儿童年龄阶段的关键词划分进行同义词合并操作,例如将类似于“蒙学”“宝宝”等标签关键词全部划分入“启蒙”中,可进一步细分出标明受众专辑的青少年和儿童年龄层次。其中,“启蒙”定义为0—6岁的学龄前孩童,“少儿”定义为7—12岁学龄期儿童,“青少年”定义为13—18岁的未成年人。
按以上规则划分统计后可以得知,少儿是其中占比最大的受众年龄层次,遥遥领先于其他两个年龄层次,占74%;启蒙占23%,接近1/4,是不容忽视的差异化受众群体;青少年是占比最少的受众群体,仅占3%,几乎可以忽略不计。
受众评论分析。喜马拉雅FM平台的专辑评论区主要由“评论正文”“打分”与“评论的回复”三部分组成,评论直观地反映了受众对于国学有声读物专辑的态度,以及他们对于专辑的关注点。笔者挑选1000张专辑中播放量前10%的优质专辑,对“评论正文”和“打分”这两个部分的数据进行采集,初步得到打分为1—10分的所有评论和部分未打分的所有评论。
首先,评论情感倾向分析。共得到28357条积极评论、856条消极评论和少量没有明确态度的中性评论。总体来看,由于播放量较高的专辑总体素质较为优质,积极评论的数量远远大于消极评论的数量,用户对于优质国学专辑的综合评价是比较积极的。
其次,消极评论分析。要对评论中分词筛选得出的关键词进行分析,首先需要确定一个划分关键词的分类指标。笔者使用迟雨晴提出的“数字有声读物内容质量评价因素”[7]中的一级指标进行大类的划分。该评价因素一级指标分别有选题质量、知识质量、播读质量、录音质量、后期质量,每个指标对应的关键词如表2所示,关键词由消极评论分词筛选后的高频相关词汇(出现频次≥1)组成。由于关键词过多,表中指标只展示部分典型词汇。
按以上规则统计得出消极评论质量评价指标占比:知识质量(50%)>选题质量(21%)>录音质量(13%)>播读质量(9%)>后期质量(7%)。从数据可以得知,有关知识质量方面的消极评论占到评论总量的一半以上,录音质量、播读质量、后期质量等因素占比较为接近,共占29%。可见,导致受众消极评价的因素主要还是在于专辑的内涵(选题与知识)有所欠缺;同时对表现形式(播读、录音与后期)亦有关注,但占比较小。
最后,积极评论分析。与消极关键词对比可以发现,由于数据量的增加,各指标中对应关键词数量和维度丰富程度都有提升,特别是“播读质量”指标下的增加尤为明显。
按以上规则统计得到的积极评论的质量评价指标占比:知识质量(38%)>播读质量(24%)>选题质量(24%)>录音质量(11%)>后期质量(3%)。与消极评论对比看出,播读质量因素和选题质量的占比都有所增加,各占24%。在积极评论中,受众对专辑表现形式(播读、录音与后期)的关注增加,占38%。虽仍低于专辑的内涵(选题与知识),但表现形式因素的占比相较于消极评论中有了显著增加,在增进受众的满意度方面有着积极作用。
思考与建议
根据对喜马拉雅FM国学类有声读物选材主题、受众群体、用户评价的数据分析可以发现:生产者大量提供的内容并不一定能获取相应的高播放量;青少年与儿童是国学有声专辑的主力受众;专辑内涵的缺失是受众产生负面评价的主要原因,而表现形式的精彩丰富会更多地增加受众对于某张专辑的满意度。下面,就将对产生上述现象的原因进行分析,并提出针对性建议。
一是要注意选材的“边际收益递减”现象,积极开辟新内容、新形式吸引受众。如前文所述,专辑作者喜爱选择的题材与受众喜爱收听的内容之间存在一些差异,生产者大量提供的内容并不一定能获取相应的高播放量,笔者认为“边际收益递减规律”能够解释这一现象。当同一个内容之下的专辑达到饱和时,由于同种内容的受众数量是有限的,继续制作这种选材的专辑会受到边际收益递减规律的限制,即使这个专辑可能内容足够优质,实际播放量增量还是会不可避免地下降。作者要积极开发新的内容和新的表现形式,从而挖掘更多潜在受众,避免边际收益递减效应。对于受众而言,合理匹配的知识供需结构能够避免过量、重复的信息所导致的“信息过载”现象。 二是平台与作者要通力合作,开发针对更多不同年龄层次群体的国学有声内容。结果显示,青少年和儿童是高质量国学有声专辑的主要受众。而在实际生活中大部分青少年儿童,特别是低龄儿童群体,缺乏在互联网上主动搜索偏好内容收听的能力与认知力,因此可以认为这些内容多为家长特意挑选并播放的,从各种带有“给孩子的”字样的专辑标题、标签以及蒙学相关选材的受欢迎程度中可见端倪。高质量的国学内容应该能让所有人都受益,因此,首先应该通过生产者与平台的配合,打破这种刻板印象。例如可以让生产者制作相关问卷,通过平台有针对性地分发,对成年受众群体的喜好进行全面调查,制作出根据用户群体特征分层的优质内容,再通过平台配合用户大数据进行精准的个性化推荐与宣传,让更多受众能接触到与之相对应的优质国学有声内容,从而拓展受众的年龄层次。
三是制作优秀国学有声专辑,需把握住内容质量的“保健因素”與“激励因素”。“保健因素”与“激励因素”的概念来源于美国心理学家赫兹伯格的“双因素激励理论”。该理论最初在人力资源管理领域得到应用,其后被不少学者借鉴并应用于对用户激励的研究。因此,在制作国学有声专辑时确保选题适宜以及知识含金量高是第一要务,这可以被看作“保健因素”的部分。想要做好国学有声读物,不在表达方式下功夫是不行的。特别重要的是主播的素质,口齿清晰、语言组织能力强、讲述方式得体等特质可以为一个有声专辑大大加分,是获得受众好评的关键,在积极评论之中的比例相较于消极评论有着显著的提升,因此可以认为这些质量因素是一种“激励因素”。
作者温恺宁系上海大学图书情报档案系2020级硕士研究生,熊静系上海大学图书情报档案系副教授、硕士研究生导师
参考文献
[1] 栗月静. 阅读的历史:从朗读到默读[J]. 教师博览, 2012(12):54-56.
[2] 中国新闻出版研究院全国国民阅读调查课题组. 第十八次全国国民阅读调查主要发现[J]. 新阅读, 2021(5):7-9.
[3] 蔡翔, 王睿. 从国民听书率看我国有声阅读产业发展趋势[J]. 现代出版, 2018(1):65-70.
[4] 傅修延. 为什么麦克卢汉说中国人是“听觉人”——中国文化的听觉传统及其对叙事的影响[J]. 文学评论, 2016(1):135-144.
[5] 余园园. 碎片化阅读时代有声书弘扬传统文化研究——以喜马拉雅FM为例[D]. 南昌: 南昌大学, 2019.
[6] 陈峥. 不平行的空间:用户生成内容大数据质量探析[J]. 图书馆, 2021(3):90-98.
[7] 迟雨晴. 我国数字有声读物内容质量问题研究[D]. 南京: 南京大学, 2020.