大规模汉语词汇语义知识库的构建

来源 :山西大学学报(自然科学版) | 被引量 : 0次 | 上传用户:peibinggu123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章提出了一种基于义项相似度的自动合并算法,用于整合以现代汉语语法信息词典、现代汉语虚词用法知识库和现代汉语词典(第5版)为核心,以现代汉语语义词典和同义词词林等其他19个词典为补充的多源词典和知识库,初步的构建了大规模汉语词汇语义知识库CLSKB。自动合并算法准确率达到32.9%,大幅度地提高了合并工作的效率。CLSKB共包括核心知识库CLSKB_Core和扩展知识库CLSKB_Extended。CLSKB_Core由可信度高的资源合并得到,规模约16万条。CLSKB_Extended是扩展知识库,主要资源来自网络,用于补充核心知识库,规模约33万条。该知识库可为自然语言处理中诸多领域提供丰富的词汇语义及关系信息。
其他文献
围绕窖泥功能菌开展了系列研究,提炼形成了"窖泥功能菌代谢能力调控"理论。从传统窖泥的演变趋势、以及人工培养窖泥的科学原则等角度对窖泥功能菌代谢能力调控进行解析,提出
唐人编撰的诗歌选集《国秀集》,因其所选诗人绝大多数是盛唐普通诗人,长期以来,对《国秀集》的研究比较薄弱。论文以《国秀集》为研究对象来探讨盛唐普通诗人及其诗歌。"盛唐
目的:探讨外用全反式维A酸霜是否可以抑制痤疮患者的皮脂分泌,以及对皮脂各组分的影响。方法:将痤疮患者39例随机分为试验组20例和对照组19例,试验组额部外用0.025%全反式维A
党的十八届三中全会提出,要加快转变政府职能,党的十八届四中全会在研究部署全面依法治国时,进一步提出了依法全面履行政府职能,政府职能转变在“四个全面”战略布局下也进入
称之为别议,是因为在2014年河北大学李兆淼写过《鲁迅书法研究》的硕士论文,2016年曲阜师范大学刘君倩写过《鲁迅书法刍谈》的硕士论文。他们在文中将鲁迅的个人历程,书法分
<正>抗体(antibody)指机体的免疫系统在抗原刺激下,由B淋巴细胞或记忆细胞增殖分化成的浆细胞所产生的、可与相应抗原发生特异性结合的免疫球蛋白。人类使用抗体治疗疾病已有
目的 :研究内毒素 (L PS)致伤大鼠肺组织致炎因子〔肿瘤坏死因子 α(TNFα)和白介素 6 (IL 6 )〕的 m RNA表达以及核转录因子 NF IL 6活化情况 ,探讨这两种致炎因子在肺损伤
教育测量理论在课程考试中的应用主要在于考试质量的评价。从高校课程考试的特点入手,以大量实践研究素材为依据,对教育测量理论在课程考试质量评价中的具体应用进行较为深入
【目的】选育高产、商品瓜率高、抗病性强、耐贮运的黑皮冬瓜杂交一代新品种,为我国黑皮冬瓜高效生产提供优良品种。【方法】2008年以自交系GD06-08-5为母本、自交系FW08-12-
分析了长白山北坡垂直样带3种典型原始森林地表凋落物及不同粒径土壤组分中有机质的δ13C值,并将在岳桦林样地(EB,海拔1996m)采集的20cm土柱分别置换到云冷杉林(SF,海拔1350m