论文部分内容阅读
目前大多数东巴经典原始手稿被十多个国家的著名机构收藏,学术研究处于分散形态,沟通不便。构建东巴古籍共享平台有利于经典文化的抢救与传承。针对东巴古籍资源的数字化以及数据存储的问题,在分析现有信息抽取方法以及数据存储方式的基础上,提出了《中国少数民族古籍总目提要(纳西卷)》纸质书籍的数字化方法,并使用元数据表示从纸质书籍中抽取的东巴古籍书目,最终使用XML数据库管理数字化后的内容。实验结果表明,提出的信息抽取方法能够针对东巴古籍书目的特殊结构正确地抽取内容,并提供结构化检索手段。验证了该方法的可行性、正确性。