【摘 要】
:
对于可用于司法作者识别的有效的判别特征,学界一向有强烈的研究热情,尤其当其涉及最有挑战性且频繁作为司法证据使用的文本体裁之一——即时消息的时候。本研究致力于为中文即时消息作者识别开展一项任务,检验一系列基于依存语法抽取得到的句法特征的判别力,以提供更多在司法作者识别任务中可供选择使用的候选特征。提出的特征包括平均依存距离、平均等级距离和各依存关系类型的相对频数。方法上,研究开展了一系列分类实验以证
论文部分内容阅读
对于可用于司法作者识别的有效的判别特征,学界一向有强烈的研究热情,尤其当其涉及最有挑战性且频繁作为司法证据使用的文本体裁之一——即时消息的时候。本研究致力于为中文即时消息作者识别开展一项任务,检验一系列基于依存语法抽取得到的句法特征的判别力,以提供更多在司法作者识别任务中可供选择使用的候选特征。提出的特征包括平均依存距离、平均等级距离和各依存关系类型的相对频数。方法上,研究开展了一系列分类实验以证实所提出特征的判别能力:特征提取自人工标注的微信消息,微信消息产生于作者的自然语言,作者间既存在社会语言学相似性又存在社会语言学相异性;特征输入至分类算法中以训练模型,基于模型对特征的判别能力进行评估;实验考虑了不同的特征集和作者组合。统计显著的结果证实了特征在中文即时消息作者识别中的判别能力。对于存在社会语言学相似性和社会语言学相异性的作者识别任务,这些特征都作出了不同的贡献。值得一提的是,在一个涉及高达五名作者且作者间存在社会语言学相似性的案例中,这些特征有令人满意的表现。此外,包含更多特征的特征集和包含更少作者的作者组合能带来更好的结果。最后,对作者们的一些代表性句子的深入句法分析阐明了特征在不同的作者识别任务中发挥的具体作用,并表明构成特征判别能力基础的可能语言机制是句法协同。
其他文献
人体通过细胞间通讯进行各项生理活动。除细胞间直接接触和分泌小分子传递信息外,还存在第三种细胞间通讯方式——即细胞向胞外释放一种称之为外泌体的转运载体。外泌体与细胞具有类似的磷脂膜结构,携带含母细胞信息的核酸和蛋白质,表面糖基化的磷脂和糖蛋白参与重要生理过程,其组分的改变与许多疾病的发生密切相关。目前医用确诊癌症方法为组织切片法,然而该方法只有到癌症中后期才能确诊。研究发现,外泌体直径随机分布在30
随着科学技术的快速更新换代、人民生活水平的不断改善、环保政策的日益严格,锂离子电池在生活中的应用领域越来越广泛、使用的频率越来越高,锂离子电池的产量也越来越大。然
光滑粒子流体动力学(Smoothed Particle Hydrodynamics,SPH)方法是一种典型的无网格法,其计算过程的核心是通过核函数近似和粒子近似的思想插值计算得到场函数及其导数。由于SPH方法的计算基于节点或粒子,摆脱了网格的约束,因此特别适用于计算有限元和有限差分法难以处理的问题,例如裂纹扩展、材料大变形、高速撞击等问题,现已成为发展迅速、应用广泛的数值模拟技术之一。然而,随着S
J亚群禽白血病病毒(Subgroup J Avian Leukosis Virus,ALV-J)在世界各地广泛流行,能引起禽类多种具有传染性的良性和恶性肿瘤疾病,造成巨大的经济损失。ALV-J在我国宿主范围
齿轮作为核心传动零件,在汽车、机械、航空航天和高铁等行业中有着广泛的应用。齿轮钢通常要求具有高的疲劳性能以确保齿轮在服役过程中不发生失效。鉴于高铁齿轮在运行过程中承受超长周次(大于107)循环载荷,开展高铁齿轮材料的超高周疲劳性能研究具有重要意义。18CrNiMo7-6渗碳齿轮钢是常用的高铁齿轮材料,其超高周疲劳性能未见报道。本文采用超声波疲劳加载方法,研究了18CrNiMo7-6渗碳齿轮钢的超高
为了实现安全的车载网络通信,研究人员提出使用加密技术为车载网络中的消息认证提供保障,然而目前基于公钥基础设施的认证方案只能为身份认证建立防御,却不能从已经授权的车辆中区分出不可信的车辆,难以保证消息的可靠性。另一方面,为了实现车载网络中的新型应用,如视频流下载等,已经出现了大量将云计算与车载网络相结合的研究。然而,现有方案很少考虑到多个云服务提供商,简称多云,环境下的车载网络认证问题。针对上述两个
概率论是数学的重要组成部分,而在概率论中概率极限理论扮演着重要的角色,许多统计学者对其进行系统的的研究,概率极限理论已经日益成熟.随着更深入的研究,学者们发现END变量和WOD变量在相依序列中具有重要的研究价值,很多学者对其进行研究.本文通过现有相依序列的一些性质和不等式,对END随机变量和WOD随机变量的相关收敛性及其应用进行进一步研究.本文的主要研究内容如下.第一章,本章介绍了文章的研究背景、
宽谱光源广泛应用于光纤陀螺系统、光学相干层析成像系统、光纤传感等低相干系统中。伴随着生产科研需求的不断提高,低相干探测系统向着高精度的方向发展,研究并提高系统的性能指标是十分急需和迫切的。散粒噪声、热噪声和光源相对强度噪声(Relative Intensity Noise,RIN)构成了系统的光学噪声。其中RIN是最需要被深入了解的,也是最重要的限制低相干系统最小可探测性能的因素,所以透彻了解宽谱
等离子体具有特殊的电磁性质,会对入射的电磁波产生严重衰减。如果等离子体覆盖在飞行器表面,严重时会导致与外界的通信中断,传统的微波雷达也难以追踪和发现此类目标。太赫兹波频率高于微波,具有更强的穿透性和方向性,能够穿透高密度的等离子体。因此研究太赫兹波在等离子体中的传播特性,对于提升航天器安全性、推进国防科技进步具有重要意义本文的研究主要分为以下几个部分:首先,使用数值计算的方法模拟仿真了平面形和圆柱
管道作为电力、石油、化工厂等许多工业场所的基本构件,用于液体或气体短距离和长距离的传输。随着经济发展和产业结构优化,大量工业场所面临着产业升级,管道重建成为了解工厂现状的重要手段。此外,随着互联网的快速发展以及三维数字化世界的普及,工厂数字化在企业管理中起着重要角色,高质量的三维管道模型在灾难模拟、检测和培训等许多应用中起着至关重要的作用。如今随着激光扫描技术的提高,高质量的点云成为三维场景的主要