基于最大熵的泰语句子级实体从属关系抽取

来源 :2016苏鲁黑浙四省声学技术学术会议 | 被引量 : 0次 | 上传用户:q5108947
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用基于最大熵模型的方法对泰语句子级实体从属关系的抽取方法进行了研究.针对泰语句子中实体关系抽取的研究进程中语料库较为匮乏的问题,首先使用汉泰双语平行句对作为中间桥梁,将中文研究领域中相对成熟的分词、词性标注和实体识别等成果,通过汉泰双语词典映射到与中文句子相对齐的泰语句子上,对泰语句子进行必要的数据处理操作,并进行一定量的人工校正和人工实体关系标注工作;进而构建基础的泰语实体关系训练语料库.在语料库的基础上,将泰语实体关系抽取问题转化为分类问题,同时结合泰语语言本身的特点,选取合适的上下文特征模板,使用最大熵模型算法对训练语料进行学习训练,构建分类器,对泰语句子中的候选实体关系三元组进行识别,最终达到实体间从属关系自动抽取的目的.实验结果显示该方法可使F值相对于已有的泰语实体关系抽取研究方法提升8%左右.
其他文献
“骨鲠”一词,具有多项隐喻义生发的潜力,它的广泛使用和相人“骨法”、中医诊法、人物品评、谏刺传统等密不可分。“骨鲠”在艺术批评领域的使用,也是艺术批评领域之“骨”
十三五规划指出,当前我国经济状况良好,下一步发展要大力开展改革,尤其是供给侧改革。针对图书销售行业也是如此。当前,全民阅读兴起,知识经济时代民众对知识更加渴望。图书
1文莱达鲁萨兰国与新加坡签署合作谅解备忘录。文莱达鲁萨兰国(下称:文莱)财政与经济部与新加坡8F Asset Management Pte Ltd签署合作谅解备忘录。谅解备忘录正式确定了投资
<正>成语是中华名族的文化瑰宝,在华夏民族五十年的历史长河中,成语一直是汉语言文化当中一颗闪耀的明星。小学语文教学当中,如何能够让学生更好的学习成语,成为许多小学语文
会议
既有住宅加装电梯是老旧小区改造和解决居家养老问题的重要措施之一。本文以加梯工作主导类型、实施主体运作机制和行政审批程序三个方面为切入点,调研了我国多个省市既有住
21世纪随着社会的不断发展,迫切需要德、智、体全面发展的高质量人才,不但要求人才的外在素质较高,而且要求人才的身心内在素质也较强。学生接受体育锻炼最直接的课堂就是体
为提高加气混凝土在低密度时的力学性能和热工性能,以粉煤灰、陶粒、双氧水、纳米CaCO3等为原料,通过化学发泡法制备了轻质高强陶粒加气混凝土。采用单因素控制变量进行试验,分
卫星平台的电子设备随着电子技术及其应用的发展,向着集成化和通用化的方向发展。综合电子系统的提出,是对上述特点的集中体现。卫星综合电子系统主要实现传统卫星的数管、测
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
采用乙醇沉淀、DEAE-纤维素离子交换层析和Sepharose CL-6B凝胶过滤层析法,从平贝母(Fritillaria ussuriensis Maxim)水提取液中分离纯化得到水溶性多糖,命名为FUP-1。通过红外