数字人文下的典籍深度学习实体自动识别模型构建及应用研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:jhh760606
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]典籍是我国传统文化、思想和智慧的载体,结合数字人文的数据获取、标注和分析方法对典籍进行实体自动识别,对于后续应用研究具有重要意义。[方法/过程]基于经过自动分词与人工标注的25本先秦典籍构建古籍语料库,分别基于不同规模的语料库和Bi-LSTM、Bi-LSTMAttention、Bi-LSTM-CRF、Bi-LSTM-CRF-Attention、Bi-RNN和Bi-RNN-CRF、BERT等7种深度学习模型,从中抽取构成历史事件的相应实体并进行效果对比。[结果/结论]在全部语料上训练得到的Bi-LSTM-Attention与Bi-RNN-CRF模型的准确率分别达到89.79%和89.33%,证实了深度学习应用于大规模文本数据集的可行性。
其他文献
生活环境包括我们居住、工作及文化娱乐场所,是人类一生中接触时间最长的周边环境.当人类从原始的蒙昧状态跨入文明社会,从部落发展成为村庄、城市,也就是从那时起,人类抵御
目的:对股骨髁上骨折分类、手术适应症及交锁髓内针操作要领及术后膝关节功能恢复进行研讨.方法:在X线监视下采用膝前正中切口,逆行髓内针对股骨髁上骨折内固定,术后早期功能
空腹吃糖有害——有人在感到饥饿时,往往是吃一块糖或喝一杯糖水充饥,认为这样既可保持身体热量又能顶饿。然而,英国著名生理学家安娜·哈丁经多年研究指出,空腹喝糖茶,或饮
选取岩溶地区花溪河流域为研究对象,运用δ15N-NO_3-,δ18O-NO_3-和δ18O-H_2O同位素技术和水化学分析方法,阐明了研究区地表水和地下水中硝酸盐的分布特征,并揭示其来源和形成过程,基于R语言下运行的贝叶斯模型(stable isotope analysis in R),对研究区水体中各种硝酸盐来源的贡献比例进行了定量识别,以期对以花溪河流域为代表的典型岩溶流域水体硝酸盐污染的源头
网络流量时间序列受到复杂背景信息干扰时,预测精度不高的问题,提出一种基于四阶累积量自适应特征提取的网络流量预测算法.构建网络流量数据传输结构模型,采用四阶累积量自适