【摘 要】
:
本篇文章基于定量语言学中离群值检测的新视角研究了开膛手杰克信件的作者权归属。白教堂谋杀案发生后,有200多封写给中央新闻社和伦敦警察局的信,上面有开膛手杰克的签名。对于这200多封信件是否都是开膛手杰克本人所写,以及开膛手杰克到底是谁这两个问题,学术界依旧存在很大的争论。首先,对于这200多封开膛手杰克信件是否都是本人所写这个问题,最流行的理论是,其中一些信件是由中央新闻社的记者捏造的,目的是增加
论文部分内容阅读
本篇文章基于定量语言学中离群值检测的新视角研究了开膛手杰克信件的作者权归属。白教堂谋杀案发生后,有200多封写给中央新闻社和伦敦警察局的信,上面有开膛手杰克的签名。对于这200多封信件是否都是开膛手杰克本人所写,以及开膛手杰克到底是谁这两个问题,学术界依旧存在很大的争论。首先,对于这200多封开膛手杰克信件是否都是本人所写这个问题,最流行的理论是,其中一些信件是由中央新闻社的记者捏造的,目的是增加报纸的销量。其次,对于开膛手杰克的身份问题,最流行的理论是,50岁的利物浦棉花商人詹姆斯·梅布里克是真正的开膛手杰克。时至今日,这两个问题依旧没有定论。本篇文章的研究目的有三,一是识别出开膛手杰克信件中的伪造信件;二是探究詹姆斯·梅布里克的日记条目是否和开膛手杰克信件在语言上相似,怎么相似;三是对比开膛手杰克信件中的伪造信件和真实信件,挖掘出真实信件的独特语言特征,总结出真实信件的写作风格。为了实现这三个研究目的,本研究以白教堂谋杀案发生后200多封存档的开膛手杰克信件的数字OCR版本为语料库,采用基于语料库和数据驱动的方法来研究开膛手杰克信件的语言学特征,比如词频分布、单词词块和字母块,提出了一种新颖的离群值检测方法。在离群值检测的新视角下,词块和字母块是离群值检测的特征表征,同时也是最终结果的投票者,这样有助于更准确识别开膛手杰克信件中的伪造文本。研究还对开膛手杰克的候选人詹姆斯·梅布里克的日记样本条目进行了离群值检测分析,对詹姆斯·梅布里克和开膛手杰克两者的关系进行定量角度的说明。此外,本研究还进行了详细的定性分析,以发现可能的伪造信件和真实信件之间的语言特征的区别。本研究的结果提供了开膛手杰克的信件中可能的伪造信件名单。同时,研究结果表明,詹姆斯·梅布里克的日记条目并不属于离群值。研究结果揭示了信件中存在的作者风格的一致性,总结了真实信件的作者写作风格,并进一步从语言特征层面举例来支持定量发现。这项研究不仅对定量语言学的研究者有意义,而且对法医研究、文学和自然语言处理领域的研究者也有意义。
其他文献
民族文化变迁与融合是当前国内外学术界常探讨的热点问题之一,也是民族学和社会学研究的重大课题之一。民族文化是某一民族在长期共同生产生活实践中产生和创造出来的,能够体现本民族特点的物质和精神财富总和,反映该民族历史发展的水平。民族文化随着社会的发展,都会发生变迁以适应族群的生存与发展。作为传统的游牧民族,蒙古民族文化的核心包含草原文化和宗教文化两个部分。作为民族文化的载体,民族文化的发展不仅有传承,而
相变存储器(Phase Change Memory,PCM)作为一种非易失性存储器有望取代闪存成为下一代主流存储技术之一。为了提高储存密度和成本竞争力,目前采用三维堆叠的三维相变存储器(3D PCM)受到业界的普遍关注,但现有3D PCM主要采用基于交叉点阵(Cross-point)结构的三维水平堆叠方式,因工艺制约存在不可避免的堆叠层数极限,并且PCM突出的热串扰问题也限制了储存密度的进一步提升
同行评审是现代科学出版过程中的核心组成部分,是筛选所提交稿件的质量控制机制。在评审过程中产生的评审报告则是提升稿件质量、影响编辑决策的重要因素。然而早期由于同行评审的非公开性,研究者较难获取评审报告进行文本分析。因此相关研究多集中讨论同行评审程序的质量问题,而对评审报告内容的研究相对较少,关于评审具体是如何展开评价的研究也十分匮乏。为促进对评审报告中评价的了解,本研究收集了2014年至2018年在
在自然界的生物、物理系统中均存在着丰富的构型以及协同合作行为,低智能的个体之间通过相互作用能够激发出复杂的群体智能。开展群集动力学系统的研究一方面有助于揭示群集复杂的自组织行为背后的机理,另一方面其衍生的理论及技术有望满足智能制造、无人群集系统控制等国家重大战略需求。本文主要结合复杂系统中的自旋概念,针对群集系统的构型控制与集体决策问题进行了相关研究,并取得了如下研究成果:针对微观物质构型相变与宏
“暴露与讽刺”是一场发生在四十年代的文学论争,它由1938年张天翼发表在《文艺阵地》的短篇小说《华威先生》而起。这篇小说率先刻画了一个抗战初期工作中不干实事空喊口号的人物形象,暴露和讽刺了抗战阵营内部的黑暗面和问题。引起了抗战文学要不要暴露和讽刺、需要怎么样的暴露与讽刺、如何通过提高暴露与讽刺的艺术水平而更好地为抗战服务等讨论。这些问题与现实主义紧密相关,体现出四十年代作家在调和现实主义客观真实性
多丽丝·莱辛的人生经历了两次空间迁移,一次是从德黑兰迁至英属殖民地南罗德西亚,另一次是从非洲殖民地回到英国伦敦。这两次空间迁移对莱辛的创作和空间记忆产生了很大的影响。纵观莱辛的整个创作历程,她关注全人类的命运、关注社会现实与时代问题,她充满温情与人文主义关怀地展现了人类普遍性的生存经验,深刻思考现代社会人们所面临的性别、种族、阶级等问题,以艺术形式表达出对现代社会危机的救赎。本文以空间批评理论为支
中国文化产业近几年发展迅速,国家大力扶持非物质文化遗产项目,作为我国非物质文化遗产的吴罗如今却面临着传承困难、知名度低、无法融入现代社会等困境。在体验经济时代,顾客需要更多维度的刺激。本文以品牌体验为指导理论,以期帮助非遗吴罗品牌建立适应当下市场需求的品牌体验策略,让大众站在全新的视角去与吴罗品牌互动。为吴罗品牌的文化传承和商业发展提供支持。本研究以文化视角介入品牌体验设计策略。基于对品牌文化、品
聂华苓是中国当代文坛颇具影响力的海外华人女性作家,她以创办爱荷华“国际写作计划”而蜚声文坛,也因独具特色的文学创作而越来越受到研究者们的关注。颇富特色的女性写作是聂华苓文学创作的重要“基色”。在小说《失去的金铃子》《桑青与桃红》《千山外,水长流》中,聂华苓立足于自身文化背景,通过对女性形象的塑造和女性意识的阐发,加以历史叙事的辅助,标识出鲜明的主体精神,在海外华文女性作家群体中独树一帜,在二十世纪
随着计算机网络的持续发展,互联网不断涌现出新型的应用。不同的应用场景对服务质量(Quality of Service,Qo S)指标具有差异化的需求。如何在网络路由中,使用合适的路由算法来满足多元化应用的服务质量保证成为了网络资源优化的重难点。深度强化学习(Deep Reinforcement Learning,DRL)技术已经在端到端的路由优化问题中得到了应用,然而基于DRL的网络路由技术仍然存
在数据时代,依托于算法的人工智能在经济生产和社会生活中展现了出了极大的优势,提高了生产效率,便利了生活服务;算法也越来越多地被用于社会公共治理和服务当中,提高了社会公共治理和服务水平。但与此同时,算法歧视等算法不当应用产生的负面影响制约着人工智能的应用、发展与创新,损害使用者的权益,使得算法权力失序扩张。随着算法应用领域的不断扩展,算法歧视造成的负面影响也越来越大,对算法歧视的治理迫在眉睫。对算法