基于汉英词性组合的短语级平行语料类别知识挖掘研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:xuqinxiaofan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于通过具体实验确定的Bisecting K-means聚类和Lemmatization形态变换算法,在汉英短语级人文社会科学平行语料基础上,尝试进行类别知识挖掘的实验.在中文社会科学引文索引(CSSCI)的类别和标题知识基础上,完成对汉英语料的预处理,并分析名词、动词和形容词的分布状况.在名词、动词和形容词等词性的组合基础上,对比不同词性组合的效果并确定最优的词性组合类别知识挖掘模型.
其他文献
经济全球化给中国社会带来了巨大的变化,中国与世界的联系日益密切。中国外交在争取和平稳定的国际环境、睦邻友好的周边环境、平等互利的合作环境和客观友善的舆论环境方面发
本文通过对国外大学图书馆文化与国内大学图书馆文化的比较研究,并结合笔者所在高校在校园文化建设过程中,努力开展图书馆文化建设的实例,谈在网络环境及数字图书馆的冲击下,如何
本文通过对荣华二采区10
信息资源共享一直是国内外理论研究的热点,通过多年的研究,取得了一定的成果。但目前我国信息资源共享的观点和理论有着明显的计划经济时代的烙印。随着社会信息资源利用水平
对陕西省35所高校图书馆揭示OA资源的情况进行调查,并对调查结果进行分析。针对调查结果中所发现的OA资源揭示率低、名称设置不规范、资源整合能力较差等问题,从科学规划OA资
与目前人类营养发展的趋势不同,许多猪营养师仍然从传统角度来看待必需脂肪酸在猪营养上的作用,但是时代正在改变.
以《中国哲社学术图书基本书目(1995-2005)》收录的政法类图书书目为标准书目,以上海地区本科以上高校图书馆馆藏中文图书数据库为测评对象,测定超星数字图书馆和方正Apabi数
科技型中小企业作为国家自主创新的中坚力量,越来越受到我国政府的重视。近年来,国家通过制定法规政策、提供专项资金支持等方式,营造有利于技术创新的环境,扶持科技型中小企业的
随着时代的进步,科学技术在经济、社会发展中的作用日益突出。同时现代科学也呈现出高度分化和高度综合的特点,为了适应现代科学的发展,科研主体也从单一化向合作化转变,学术共同体应运而生。本文以国家科技进步奖作为数据源,利用知识图谱对学术共同体的科研合作状况进行研究,并提出学术共同体科研合作的问题与改进措施。本篇论文的主要内容包括以下几个部分:第一部分,基础理论介绍。在这一部分中,笔者通过对已有研究成果的
在猪的商用日粮中,纤维主要来自谷物及其副产品,其中阿拉伯木聚糖和纤维素的数量最多,但它们难以被猪体内的内源性酶和微生物酶(microbial enzymes)消化.为了提高这些纤维的