基于先秦语料库的古汉语地名自动识别模型构建研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:yeah88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程]对《春秋左氏传》中的地名的内部和外部特征进行统计分析,构建模型的特征模板。在规模为187 901个词汇的训练和测试语料上,对比条件随机场模型和最大熵模型的地名识别效果,把调和平均数为90.94%的条件随机场训练模型确定为最佳,作为本文所要构建的模型,并在《国语》语料上进行验证。[结果/结论]在古汉语地名自动识别中,条件随机场模型优于最大熵模型,基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。
其他文献
企业的竞争情报工作,是为了提高企业的竞争地位而进行的情报信息活动。从本质上说它包括有效地搜集、处理、分析和利用竞争对手相关情报;以及有效地保护本企业的情报和干扰竞
专利地图是图形化处理专利信息、系统管理专利、协助制定专利战略的方法。引文路径分析是统计、归纳、比较引文信息,并进行可视化处理,以揭示引文数量特征和内在规律的计量分析方法。本文提出基于引文路径分析的专利技术演进图,是将专利引文路径的可视化分析与专利技术地图结合,并加入专利技术在时间序列上的发展状况分析,来绘制专利技术演进图。这使得专利技术演进图别于已有的专利地图,可以梳理技术发展脉络、挖掘技术热点,
伴随着全球化步伐的加快,越来越多的研发企业开始采用项目组的方式开展活动,项目知识共享也受到了广泛的关注。本文主要针对企业项目知识共享展开,重点讨论了项目知识共享模
目的:提高临床合理用药水平,提高药师处方审核的效率与质量,构建医院审方中心平台,探讨在临床合理用药中的效果.方法:引入审方中心系统,通过建立和维护系统的知识库,协助药师