【摘 要】
:
古文句读不仅需要考虑当前文本的语义和语境信息,还需要综合历史文化常识,对专家知识有较高要求。该文提出了一种基于深层语言模型(BERT)的古汉语知识表示方法,并在此基础上
【机 构】
:
北京师范大学中文信息处理研究所,北京师范大学汉语文化学院,北京师范大学文学院
【基金项目】
:
国家自然科学基金(62006021),教育部人文社会科学研究青年基金(18YJC751073),国家社会科学基金(18ZDA238)。
论文部分内容阅读
古文句读不仅需要考虑当前文本的语义和语境信息,还需要综合历史文化常识,对专家知识有较高要求。该文提出了一种基于深层语言模型(BERT)的古汉语知识表示方法,并在此基础上通过条件随机场和卷积神经网络实现了高精度的自动断句模型。在诗、词和古文三种文体上,模型断句F1值分别达到99%、95%和92%以上。在表达较为灵活的词和古文文体上,模型较之传统双向循环神经网络方法的F1值提升幅度达到10%以上。实验数据显示,模型能较好地捕捉诗词表达的节奏感和韵律感,也能充分利用上下文信息,实现语序、语法、语义、语境等信息的
其他文献
汉语方言分区研究是语言学的重要组成部分。鉴于传统基于词汇和语法的人工方言分区方法具有一定的主观性,该文研究了如何有效利用语音本身特征进行方言的自动分区。论文首先
一、对美术新课程标准的理解 自实施新课程以来,学校组织教师采取多种方式,认真学习,结合课改以前的教学理念所采用的教学方法,比较对照、深刻领会、更新观念。美术学科具有与其他学科不同的特点,对新课程标准的理解有以下几点: 1.美术课程突出体现基础性、普及性和发展性,使美术教育面向全体学生,不同的学生在美术教育上得到不同的发展。美术内容是现实的、有意义的、富有挑战性的,更加有利于学生主动地进行观察、
该文探究手术操作术语归一化方法的构建。首先,分析手术操作术语归一化数据集的特点;其次,调研术语归一化的相关方法;最后,结合调研知悉的技术理论方法和数据集特征,建立手术