搜索引擎用户查询中的复杂专有名词识别

来源 :计算机工程与应用 | 被引量 : 5次 | 上传用户:lihao527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专有名词识别(Named-Entity Recognition,NER)是自然语言处理和信息检索的基础。现有的很多文献集中于人名、地名、机构名等的识别,很少涉及到书名和电影名等较为复杂的专有名词。专注于某搜索引擎的用户查询日志中出现的这类复杂专有名词的识别。根据用户的查询在网络中的上下文数据,将查询进行粗切分,并利用该网络数据作为训练语料训练复杂专名分类器。使用三种不同的分类器,证实该方法能取得相当好的效果。
其他文献
兰渝铁路兰州枢纽小沙沟1#大桥最高墩达62.5 m,采用翻模法施工,现场利用工地既有材料,通过参考相关实例、结合以往施工中遇到的问题加以改进,制作了模板附着式简易作业平台,
针对昆明市六甲乡跨官南路高速公路跨线桥,介绍了该桥的整体设计,以及拱肋、拱脚、系梁、吊杆等主要构件的设计特点。采用有限元分析软件MidasCivil和MidasFEA进行了全桥整体计
基于独特型免疫网络原理,提出了一种新型的分区记忆模式人工独特型网络模型,并利用其对卫星遥感数据进行了分类。该模型在结构上将免疫网络的记忆抗体划分为特异记忆抗体区和自由记忆抗体区。前者的主要功能是记忆各类别抗原的特异特征,后者为前者提供各种类型的抗体源。记忆抗体间按照亚动力学原理进行调节,实现免疫网络的寻优过程。基于上述分区,它在初次免疫响应过程中实现网络的搭建和训练,在二次免疫响应过程中实现信息提
介绍了深圳地铁2、11号线与广深港客运专线福田车站节点深南大道上立交桥钢箱梁的吊装施工方案,在已施工完毕的地下车站上通过吊车对立交桥进行了钢梁吊装施工。利用数值计算
通过宁杭高铁水泥乳化沥青砂浆的施工实例,分析了水泥乳化沥青砂浆的原材料、配合比以及润湿、封边、灌浆、养护等工艺对施工质量的影响,重点阐述了各阶段施工质量控制要点,提出