【摘 要】
:
针对领域术语抽取中含字长度较大的术语被错误切分的问题,本文提出一种基于术语长度和语法特征的统计领域术语抽取方法。本方法在利用机器学习抽取候选术语时,加入基于术语长
【机 构】
:
天津理工大学计算机视觉与系统省部共建教育部重点实验室,天津理工大学天津市智能计算及软件新技术重点实验室
【基金项目】
:
国家自然科学基金项目(71501141,61301140), 天津市科技特派员项目(15JCTPJC63800)
论文部分内容阅读
针对领域术语抽取中含字长度较大的术语被错误切分的问题,本文提出一种基于术语长度和语法特征的统计领域术语抽取方法。本方法在利用机器学习抽取候选术语时,加入基于术语长度和语法特征的约束规则;在使用统计方法确定候选术语的领域性时,充分考虑词长比这一概念的重要性,将其作为判断术语领域性的重要权值。实验表明,提出的方法能够正确抽取含字长度较大的领域术语,抽取结果的准确率和召回率相比以往的方法有所提高。
其他文献
习近平总书记对广东“四个坚持、三个支撑、两个走在前列”的重要批示,从战略和全局高度为广东发展把脉定位,充分展现了总书记治国理政新理念、新思路、新战略的科学性、真理性
目的:研究慢性肝病血清中可溶性Ⅰ型补体受体(sCR1)的浓度变化和层粘连蛋白的含量变化,并分析二者的相关性,以探讨其临床意义。方法:采用双抗体夹心ELISA法测定血清中sCR1浓度,采用
推进广州金融开放,助力粤港澳大湾区国际金融枢纽建设6月21~23日,第八届中国(广州)国际金融交易·博览会(简称“金交会”)在广州琶洲中国进出口商品交易会展馆B区举行。
现较为成熟的CFD仿真软件均为国外所有,国内缺乏相应的知识产权。为此,本文自主研发了一套仿真程序,对内燃机缸内三维工作过程进行数值模拟。本文建立了动态层网格模型和匹配的
非酒精性脂肪性肝病(NAFLD)是一种与胰岛素抵抗(IR)和遗传易感密切相关的代谢应激性肝脏损伤,疾病谱包括非酒精性单纯性脂肪肝(NAFL)、非酒精性脂肪性肝炎(NASH)及其相关肝硬化和肝细
目的探讨腰-硬联合麻醉在老年妇科肿瘤手术中的应用效果。方法选取110例老年妇科肿瘤患者,均进行肿瘤切除手术,随机分成两组,观察组55例采用腰-硬联合麻醉,对照组55例采用单
近年来,胸科手术中老年患者的比例在增加。而老年患者术前伴随疾病较多,术后易出现并发症,特别是在疼痛未能得到充分控制的情况下。良好的术后镇痛对于加快患者恢复,改善患者的愈
2017年4月,随着雄安新区获批,雄安新区成了深圳特区和浦东新区之后又一个国家级的新区,被定义为'千年大计,国家大事'的雄安新区,其设立代表了我国区域发展战略新的方