论文部分内容阅读
摘 要:随着“汉语热”的全面兴起和中西两国在政治、经济、文化等方面的交流日益频繁,西班牙报刊对中国的关注度日益提高。本文选取西班牙《国家报》作为语料来源自建一个小型涉华主题词语料库,构建了包含三级主题词的标注体系,并抽取语料样本进行标注分析。该涉华主题词体系的构建不仅为主题式汉语教学提供动态主题教学资源,也为西班牙孔子学院、孔子课堂构建并引导良好的舆论环境提供参考。
关键词:《国家报》;西班牙;语料库;主题词
1 建库目的
国内外以报刊为语料来源的语料库建设研究已取得了许多成果,例如国家语言资源动态流通语料库(简称DCC)的语料来源包括了《人民日报》、《新京报》等17种国内主流报纸;暨南大学东南亚主要华文媒体语料库的语料来源于东南亚华文报纸及华语网站;但目前以西班牙报刊为语料来源的语料库建设还比较空白。针对国外汉语学习者,国内较大的HSK动态作文语料库仅收录了西班牙汉语学习者11篇语料,相比于韩国(4171篇)和日本(3211篇)等国家,[1]面向西班牙的汉语语料库建设还很薄弱。
而本文构建的《国家报》涉华主题词语料库一是为主题式汉语教学提供动态主题教学资源。明特(Mindt)和肯尼迪(Kennedy)等学者利用英语标准语料库,如LOB语料库,对教科书教学内容等进行分析,得出没有经验数据为基础的教学材料对学习者有误导的一般结论。黄昌宁、李涓子[2]对此提出应当用语料库研究指导教材的编写。主题式教学起源于北美,现已在母语和第二语言教学中得到了广泛应用,但主题式汉语教学相比于主题式英语教学和传统汉语教学存在教料更新慢、脱离社会交际等问题,且面向西班牙的主题类国别教材非常稀缺。此语料库的构建能让教师筛选出西班牙当地真正感兴趣的汉语主题词群,根据此类主题展开的教学,不仅能实现教学资源与时俱进、动态更新,还能提高学生学习兴趣和汉语语用能力。二是为中国尤其是西班牙八所孔子学院、七所孔子课堂构建并引导良好的舆论环境提供参考。通过分析语料库的标注数据,从积极类和消极类的涉华语料还原西班牙媒体眼中真实的中国形象,从主题词在不同领域的分布情况反映中国信息传播不足的领域。
2 语料库构建
2.1语料的来源
本语料库的语料来源于西班牙发行量最大的报纸《国家报》(El País)网络版。《国家报》创刊于1975年,平均日发行量达39.19万份,[3]已于2005年6月起向读者免费开放网站新闻信息。[4]
本文选择了2017年至2019年间,在《国家报》新闻搜索栏输入“中国(China)”关键词,检索到与中國相关的所有报道作为语料。经数据统计,2017年至2019年共有1371篇涉华报道,其中2017年406篇,2018年409篇,2019年496篇。
2.2语料库的构建
目前各类报纸栏目、《汉语主题词表》、《中图法》等都为主流报纸的主题词分类提供了参考。史艳岚[5]在提取国家语言资源动态流通语料库分类文本的基础上,综合上述分类系统,基本构成了19个领域(一级)、91个子领域(二级)以及189个具体主题(三级)的报刊新闻分类体系。一级主题词是去除通用词语的领域大类,如“政治、经济、文化”等;二级主题词是去除通用语和领域共用词语的子领域,如“文化”领域下的“传统文化、大众文化、文化交流”等;而三级主题词是从每个单一文本中提取的具体主题,如“文化交流”子领域下的“韩剧”。该分类体系非常详细全面,几乎涵盖了国内主流报纸涉及的所有主题词,并形成了三个层级的主题词都有与之相对应的主题词群。但该体系对于本文所要构建的主题词语料库存在两点不足:(1)一级主题词分类太详尽。不同于国内主流报纸,《国家报》的报道内容和受众群体主要面向西班牙时事和当地群众,涉华报道主题远不如国内报道主题丰富,因此不需要过于详细的分类。例如,把“外交”、“台湾”、“政治”三个领域合并为“政治”,把“教育”、“体育”“文化”领域合并为“文化”;(2)缺少《国家报》独有的主题。国内主流报纸和《国家报》看待中国的视角不同,选题侧重点也不同。例如“文化”领域下可以增添“孔子学院”、“中西文化交流”等子领域。
由此,本文将参考史艳岚[5]的报刊新闻分类体系,提出《国家报》涉华主题词体系的创建构想。首先将语料库的源文本由人工译为相对应的汉语译本,再建立平行语料库。本研究选取与北外通用汉英平行语料库相同的切分原则,即双语译本以句子为单位对齐,实现句子层面的对应关系。当检索西语或汉语主题词时,语料库会同时提取该词所在的双语语句。最后通过归纳和总结,建立适用于本语料库的三级主题词分类体系。一级主题词分为九大类:经济、外交、科技、文化、社会、生活、法制、军事、环境卫生;二级主题词以文化领域为例,分为七大子领域:体育运动、教育、孔子学院、中西文化交流、文化遗产、文学、影视。三级主题词为从每个单一文本提取的具体主题,如“教育”子领域包括具体主题:留学、汉语教学、高等教育、教育交流等。
2.3语料库的标注
本语料库的标注包括三个部分·······:(1)语料篇名分别使用“A、B、C、D、E、F、G、H、I”对一级主题词进行标注(对应上文排列顺序);使用“1”“2”在篇名处标注篇章的表达立场,即{一级主题词+表达立场}。本研究将客观的或带有褒扬性词汇的文本标注为积极类“1”;将歪曲事实的或带有贬低性词汇的文本比标注为消极类“2”。(2)用“【二级主题词】”标注文本的子领域。(3)用“[三级主题词]”标注文本的具体主题。(一般在文本导语里)例如:
源文本篇名:China también apaga el fútbol{B1}
汉译本篇名:中国也关闭了足球赛转播{B1}
源文本句子:China ha vuelto a enviar un mensaje al mundo deportivo internacional:prohibido criticar 【sus asuntos internos.】 汉译本句子:中国向国际体育界发出了一个信息:禁止批评【中国内政】。
源文本导语:[La televisión estatal] censura [el Arsenal-City] por el apoyo de ?zil a la minoría musulmana uigur
汉译本导语:对于厄齐尔发表支持维吾尔族穆斯林反对派的言论,[中国国家电视台]审查[阿森纳足球俱乐部]
3 抽样分析标注数据
本文随机选取了2017年至2019年间,以“文化”作为一级主题词下的语料各一篇进行标注分析。这三篇语料的标题为:
2019年:Película en Netflix y propaganda política:así es la ciencia ficción China que abduce a Occidente(以下简称“Película”)
汉译本:Netflix电影和政治宣传:一部深受西方喜爱的中国科幻小说
2018年:Banderas rojas y puntas de acero(以下简称“Banderas”)
汉译本:红旗和剑尖
2017年:Todo lo necesario para aprender bajo un mismo techo(以下简称“Todo”)
汉译本:在同个屋檐下学习的必要性
Película(2019)紧扣中国的时事热点,以电影《流浪地球》为切入点,探讨刘慈欣三部曲《三体》及其小说背后的中国政治;Banderas(2018)介绍了中央芭蕾舞团的自创芭蕾舞剧《红色娘子军》的故事背景,讲述了中芭团长冯英的故事;Todo(2017)报道了由Ifema在马德里举办的第四届教育周,吸引了来自20个国家的378个组织参与到此次教育周活动中。其中孔子学院开展了中国灯笼研讨会和就业能会议,阿里巴巴开展的电子商务研讨会,都为建设未来的教育,为年轻人调整未来职业规划提供了良好建议。《国家报》对中国文化的报道上,从对文化大革命背景的关注到对国内当下大热影视的报道以及对未來教育的展望,文本呈现出选题时间范围跨度大、时效性强、主题多样化、关注范围广的特点。同时,报道主题大多与国内正在发生且受到高度关注的新闻时事进行同步报道,往往还会进一步做出历史回顾或相关拓展。当汉语教师要讲授与“中国影视文学”相关的主题时,教师可在本语料库中检索到Película(2019)这篇文章,再结合实际授课需要,开展主题式汉语教学。选择该篇语料作为授课材料,一是通过三级主题词的层级关系,即文化——影视、文学——刘慈欣、《三体》、《流浪地球》为学习者构建了主题间的整体框架,降低了文本难度,有利于通过联想加强生词的记忆;二是本语料选取于发行量最大的《国家报》,其文本贴近生活,科幻小说主题也为大多年轻人所喜爱,能提高学生学习兴趣,达到学以致用的效果。而从表达立场来看,《国家报》对中国文化的报道相对客观公正,以积极类正面报道为主。因此,我们应抓住当地对中国文化的兴趣点,借鉴西班牙塞万提斯学院语言推广的成功经验促进文化传播,通过联合举办学术论坛、文化活动加强中国文化的宣传;另一方面,国家汉办、外交部等相关部门也要加强对文化传播的监管力度,促进中国文化优质发展。
4 总结
本文选择了西班牙《国家报》以“China”为关键词检索到的新闻报道作为语料,建立了一个小型的《国家报》涉华主题词语料库,并构建了包含三级涉华主题词的标注体系。通过对语料进行标注分析,发现《国家报》涉华主题大多与国内高热度时事同步进行报道,具有时范围跨度大、主题多样化的特点;其文本表立场以积极类正面报道为主,遵循客观事实。该语料库在实际生活中的运用为面向西班牙的主题式汉语教学提供了系统性的动态主题教学资源,也还原了西班牙媒体眼中真实的中国形象,为中国建构和引导在西的舆论环境提供重要的参考。
参考文献
[1]HSK动态作文语料库[EB/OL].http://hsk.blcu.edu.cn,2020-05-21.
[2]黄昌宁,李涓子.语料库语言学[M].北京:商务印书馆,2002.
[3]中华人民共和国外交部.西班牙国家概况[EB/OL].https://www.fmprc.gov.cn/web/gjhdq_676201/gj_676203/oz_678770/1206_679810/1206x0_679812/,2019-12/2020-05-21.
[4]“ELPAIS.es para todos”,El País,3 de junio de 2005,http://elpais.com/diario/2005/06/03/sociedad/1117749610_850215.html,2012-3-4.
[5]史艳岚.基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D].北京语言大学,2006.
关键词:《国家报》;西班牙;语料库;主题词
1 建库目的
国内外以报刊为语料来源的语料库建设研究已取得了许多成果,例如国家语言资源动态流通语料库(简称DCC)的语料来源包括了《人民日报》、《新京报》等17种国内主流报纸;暨南大学东南亚主要华文媒体语料库的语料来源于东南亚华文报纸及华语网站;但目前以西班牙报刊为语料来源的语料库建设还比较空白。针对国外汉语学习者,国内较大的HSK动态作文语料库仅收录了西班牙汉语学习者11篇语料,相比于韩国(4171篇)和日本(3211篇)等国家,[1]面向西班牙的汉语语料库建设还很薄弱。
而本文构建的《国家报》涉华主题词语料库一是为主题式汉语教学提供动态主题教学资源。明特(Mindt)和肯尼迪(Kennedy)等学者利用英语标准语料库,如LOB语料库,对教科书教学内容等进行分析,得出没有经验数据为基础的教学材料对学习者有误导的一般结论。黄昌宁、李涓子[2]对此提出应当用语料库研究指导教材的编写。主题式教学起源于北美,现已在母语和第二语言教学中得到了广泛应用,但主题式汉语教学相比于主题式英语教学和传统汉语教学存在教料更新慢、脱离社会交际等问题,且面向西班牙的主题类国别教材非常稀缺。此语料库的构建能让教师筛选出西班牙当地真正感兴趣的汉语主题词群,根据此类主题展开的教学,不仅能实现教学资源与时俱进、动态更新,还能提高学生学习兴趣和汉语语用能力。二是为中国尤其是西班牙八所孔子学院、七所孔子课堂构建并引导良好的舆论环境提供参考。通过分析语料库的标注数据,从积极类和消极类的涉华语料还原西班牙媒体眼中真实的中国形象,从主题词在不同领域的分布情况反映中国信息传播不足的领域。
2 语料库构建
2.1语料的来源
本语料库的语料来源于西班牙发行量最大的报纸《国家报》(El País)网络版。《国家报》创刊于1975年,平均日发行量达39.19万份,[3]已于2005年6月起向读者免费开放网站新闻信息。[4]
本文选择了2017年至2019年间,在《国家报》新闻搜索栏输入“中国(China)”关键词,检索到与中國相关的所有报道作为语料。经数据统计,2017年至2019年共有1371篇涉华报道,其中2017年406篇,2018年409篇,2019年496篇。
2.2语料库的构建
目前各类报纸栏目、《汉语主题词表》、《中图法》等都为主流报纸的主题词分类提供了参考。史艳岚[5]在提取国家语言资源动态流通语料库分类文本的基础上,综合上述分类系统,基本构成了19个领域(一级)、91个子领域(二级)以及189个具体主题(三级)的报刊新闻分类体系。一级主题词是去除通用词语的领域大类,如“政治、经济、文化”等;二级主题词是去除通用语和领域共用词语的子领域,如“文化”领域下的“传统文化、大众文化、文化交流”等;而三级主题词是从每个单一文本中提取的具体主题,如“文化交流”子领域下的“韩剧”。该分类体系非常详细全面,几乎涵盖了国内主流报纸涉及的所有主题词,并形成了三个层级的主题词都有与之相对应的主题词群。但该体系对于本文所要构建的主题词语料库存在两点不足:(1)一级主题词分类太详尽。不同于国内主流报纸,《国家报》的报道内容和受众群体主要面向西班牙时事和当地群众,涉华报道主题远不如国内报道主题丰富,因此不需要过于详细的分类。例如,把“外交”、“台湾”、“政治”三个领域合并为“政治”,把“教育”、“体育”“文化”领域合并为“文化”;(2)缺少《国家报》独有的主题。国内主流报纸和《国家报》看待中国的视角不同,选题侧重点也不同。例如“文化”领域下可以增添“孔子学院”、“中西文化交流”等子领域。
由此,本文将参考史艳岚[5]的报刊新闻分类体系,提出《国家报》涉华主题词体系的创建构想。首先将语料库的源文本由人工译为相对应的汉语译本,再建立平行语料库。本研究选取与北外通用汉英平行语料库相同的切分原则,即双语译本以句子为单位对齐,实现句子层面的对应关系。当检索西语或汉语主题词时,语料库会同时提取该词所在的双语语句。最后通过归纳和总结,建立适用于本语料库的三级主题词分类体系。一级主题词分为九大类:经济、外交、科技、文化、社会、生活、法制、军事、环境卫生;二级主题词以文化领域为例,分为七大子领域:体育运动、教育、孔子学院、中西文化交流、文化遗产、文学、影视。三级主题词为从每个单一文本提取的具体主题,如“教育”子领域包括具体主题:留学、汉语教学、高等教育、教育交流等。
2.3语料库的标注
本语料库的标注包括三个部分·······:(1)语料篇名分别使用“A、B、C、D、E、F、G、H、I”对一级主题词进行标注(对应上文排列顺序);使用“1”“2”在篇名处标注篇章的表达立场,即{一级主题词+表达立场}。本研究将客观的或带有褒扬性词汇的文本标注为积极类“1”;将歪曲事实的或带有贬低性词汇的文本比标注为消极类“2”。(2)用“【二级主题词】”标注文本的子领域。(3)用“[三级主题词]”标注文本的具体主题。(一般在文本导语里)例如:
源文本篇名:China también apaga el fútbol{B1}
汉译本篇名:中国也关闭了足球赛转播{B1}
源文本句子:China ha vuelto a enviar un mensaje al mundo deportivo internacional:prohibido criticar 【sus asuntos internos.】 汉译本句子:中国向国际体育界发出了一个信息:禁止批评【中国内政】。
源文本导语:[La televisión estatal] censura [el Arsenal-City] por el apoyo de ?zil a la minoría musulmana uigur
汉译本导语:对于厄齐尔发表支持维吾尔族穆斯林反对派的言论,[中国国家电视台]审查[阿森纳足球俱乐部]
3 抽样分析标注数据
本文随机选取了2017年至2019年间,以“文化”作为一级主题词下的语料各一篇进行标注分析。这三篇语料的标题为:
2019年:Película en Netflix y propaganda política:así es la ciencia ficción China que abduce a Occidente(以下简称“Película”)
汉译本:Netflix电影和政治宣传:一部深受西方喜爱的中国科幻小说
2018年:Banderas rojas y puntas de acero(以下简称“Banderas”)
汉译本:红旗和剑尖
2017年:Todo lo necesario para aprender bajo un mismo techo(以下简称“Todo”)
汉译本:在同个屋檐下学习的必要性
Película(2019)紧扣中国的时事热点,以电影《流浪地球》为切入点,探讨刘慈欣三部曲《三体》及其小说背后的中国政治;Banderas(2018)介绍了中央芭蕾舞团的自创芭蕾舞剧《红色娘子军》的故事背景,讲述了中芭团长冯英的故事;Todo(2017)报道了由Ifema在马德里举办的第四届教育周,吸引了来自20个国家的378个组织参与到此次教育周活动中。其中孔子学院开展了中国灯笼研讨会和就业能会议,阿里巴巴开展的电子商务研讨会,都为建设未来的教育,为年轻人调整未来职业规划提供了良好建议。《国家报》对中国文化的报道上,从对文化大革命背景的关注到对国内当下大热影视的报道以及对未來教育的展望,文本呈现出选题时间范围跨度大、时效性强、主题多样化、关注范围广的特点。同时,报道主题大多与国内正在发生且受到高度关注的新闻时事进行同步报道,往往还会进一步做出历史回顾或相关拓展。当汉语教师要讲授与“中国影视文学”相关的主题时,教师可在本语料库中检索到Película(2019)这篇文章,再结合实际授课需要,开展主题式汉语教学。选择该篇语料作为授课材料,一是通过三级主题词的层级关系,即文化——影视、文学——刘慈欣、《三体》、《流浪地球》为学习者构建了主题间的整体框架,降低了文本难度,有利于通过联想加强生词的记忆;二是本语料选取于发行量最大的《国家报》,其文本贴近生活,科幻小说主题也为大多年轻人所喜爱,能提高学生学习兴趣,达到学以致用的效果。而从表达立场来看,《国家报》对中国文化的报道相对客观公正,以积极类正面报道为主。因此,我们应抓住当地对中国文化的兴趣点,借鉴西班牙塞万提斯学院语言推广的成功经验促进文化传播,通过联合举办学术论坛、文化活动加强中国文化的宣传;另一方面,国家汉办、外交部等相关部门也要加强对文化传播的监管力度,促进中国文化优质发展。
4 总结
本文选择了西班牙《国家报》以“China”为关键词检索到的新闻报道作为语料,建立了一个小型的《国家报》涉华主题词语料库,并构建了包含三级涉华主题词的标注体系。通过对语料进行标注分析,发现《国家报》涉华主题大多与国内高热度时事同步进行报道,具有时范围跨度大、主题多样化的特点;其文本表立场以积极类正面报道为主,遵循客观事实。该语料库在实际生活中的运用为面向西班牙的主题式汉语教学提供了系统性的动态主题教学资源,也还原了西班牙媒体眼中真实的中国形象,为中国建构和引导在西的舆论环境提供重要的参考。
参考文献
[1]HSK动态作文语料库[EB/OL].http://hsk.blcu.edu.cn,2020-05-21.
[2]黄昌宁,李涓子.语料库语言学[M].北京:商务印书馆,2002.
[3]中华人民共和国外交部.西班牙国家概况[EB/OL].https://www.fmprc.gov.cn/web/gjhdq_676201/gj_676203/oz_678770/1206_679810/1206x0_679812/,2019-12/2020-05-21.
[4]“ELPAIS.es para todos”,El País,3 de junio de 2005,http://elpais.com/diario/2005/06/03/sociedad/1117749610_850215.html,2012-3-4.
[5]史艳岚.基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D].北京语言大学,2006.