【摘 要】
:
命名实体识别是自然语言处理研究领域中的一项很重要的基础性任务,是实体关系抽取和事件抽取等高层任务重要基石.如何在缺乏标注语料或只有少量标注语料条件下,提高命名实体
【机 构】
:
昆明理工大学 信息工程与自动化学院,昆明,650504
论文部分内容阅读
命名实体识别是自然语言处理研究领域中的一项很重要的基础性任务,是实体关系抽取和事件抽取等高层任务重要基石.如何在缺乏标注语料或只有少量标注语料条件下,提高命名实体识别的性能是自然语言处理领域的一个重要研究方向.针对这一问题,提出一种基于实例的迁移学习算法——TLNER_AdaBoost.该方法通过自动调整训练集中实例样本的权重和计算辅助训练样本的迁移能力来提高训练语料质量,并选取采用不完全标注语料的自学习方法和采用完全标注语料的基于条件随机场的方法来对该方法进行实验对比分析.经实验对比分析得知,本文方法在提高命名实体识别的准确率、召回率和F值的同时,大大降低了人工标注语料的工作量.
其他文献
近年,国际上出现了新一波的保种运动,鼓励农民留种、藏种于民,鼓励本土选育,以对抗跨国种子公司对种子自由交换的掌控和应对全球气侯的变化虾苗,也是种子.作为全球最大的对虾
为了研究电子商务服务运行机制对依靠传统供应链运行的企业的影响,在对供应链进行抽象的基础上建立了服务桥模型,用于验证不同的服务运营策略将产品或服务由供应商到达需求方
我家江水环湾处,江干多是渔人住.渔人终岁业鱼花,纳课输租设鱼步.桃花浪涌鱼花多,鲢鲩出水鳙随波.日暮渔人望电脚,江头兀坐歌渔歌.乘时置筐半浮水,鱼花入筐杓之起.满船归载月
以网络为特征的现代远程教育正在蓬勃发展。如何设计和开发优质的网络课程是现代远程教育教学面临的一个重大课题,也是难题。文章使用Moodle这个免费开源的平台来设计,试图解决
河南省林州市人民医院病房楼工程是林州市重点工程,新建病房楼包括447张床位的病房,12间手术室,建筑总高度为45.3 m,总建筑面积为2.078 426万m2,其中地下一层,建筑面积为1 553
如同人的身份标签一样,植物也需要一个识别标签,以记录植物的健康状况,帮助控制病虫害在繁殖材料间的传播。这个包含了植物的自身特征(如基因型和表型)、健康状况及病虫防治等信息的身份标签,不仅引起了植物育种和栽培专家的兴趣,同时对消费者也是有相当吸引力的。
本栏目编者按:现代社会已进入信息时代,各行各业也随着科学技术的发展突飞猛进、日新月异,消防行业也不例外。为了进一步适应对外开放,与国际惯例接轨,并方便地使用Internet,
如今,僵尸网络主要被当作一种进入企业的后门程序。一旦进入,黑客们就会以静默方式存在,并在被发现前窃取尽可能多的信息。但不幸的是,僵尸网络一般都比较隐秘,很多公司甚至都意识不到自己的计算机被感染了,而安全团队也经常不了解僵尸网络所带来的威胁。僵尸网络是攻击者出于恶意目的,传播僵尸程序以控制大量计算机,并通过一对多的命令与控制信道所组成的网络,它使得网络犯罪分子能控制计算机并进行非法活动,包括窃取数据
9月18日,大北农发布公告称,其全资子公司福建大北农水产科技有限公司拟共投资2.2亿元分别在江西省九江共青城市高新技术产业园区新建年产12万吨新型高效水产饲料项目;在江苏
时滞神经网络是解空间为无穷维的非线性动力系统,这样的系统可产生具有多个正的Lyapunov指数的超混沌行为。复杂的时间序列使得这类系统特别适用于保密通信中。针对一类时滞超混沌神经网络系统,利用单向耦合同步概念,设计了一个非线性控制器,并通过Lyapunov-Krasovskii方法和Halanay不等式引理分别给出了系统渐进同步和指数同步的与时滞无关的充分条件。通过引入控制矩阵正定的条件,避免了繁