【摘 要】
:
传统基于统计的命名实体识别方法存在需要大量人工标注的缺陷,导致识别准确率较低。为了提升识别效果,提出一种基于条件随机场的半监督学习方法(S-CRF)对命名实体进行识别。
论文部分内容阅读
传统基于统计的命名实体识别方法存在需要大量人工标注的缺陷,导致识别准确率较低。为了提升识别效果,提出一种基于条件随机场的半监督学习方法(S-CRF)对命名实体进行识别。该方法将实体识别看作序列标注问题,对少量数据进行人工标注并构建实体集,通过K-means聚类算法选取有代表性的未标注数据文本进行自动标注,采用条件随机场对语料进行训练测试。选取中文应急预案文档进行实验,该方法在各个标签上的识别效果分别达到93.52%、93.04%、95.81%。实验结果表明,该方法优于传统规则方法,能有效提高应急预案命名实
其他文献
传统互联网数据中心存在物理机资源利用率低下、难以适应业务发展需求、管理复杂和运维成本居高不下等难题,以服务的形式通过互联网交付给用户虚拟资源的云计算数据中心应运
由中国价值哲学研究会、武汉大学哲学学院、武汉大学马克思主义理论与中国实践协同创新中心、德国卢森堡基金会联合主办的主题为“面向世界的当代中国价值观念”学术研讨会暨
新形势下,汉语热不断升温,外汉语工作推动全世界快速发展。在此背景下,改善外汉语教学方法、增强外汉语教学质量,成为不容忽视的问题。"先语后文"模式的生成,为外汉语教学改
该文运用文献资料法、专家访谈法、录像分析法、逻辑分析法,数理统计法对我国女子水球队关于快攻战术方面的优缺点进行分析,进而与国外优秀队伍进行比较,针对比较出的一些问
目的:观察黄芪对发作期哮喘患者T细胞亚群细胞周期的影响,揭示黄芪在哮喘治疗中的意义。方法:课题以儿童哮喘病人T细胞亚群为研究对象,对CD4+、CD8+T细胞进行分离,采用细胞培
骨髓纤维化属于中医"积聚""癥瘕""血癥""癥积"等范畴.此病为虚实夹杂证,贫血即血虚,脾大即血瘀,吴维海主任医师认为该病的发生和发展均与血虚、 血瘀有关,辨证辨病相结合,以祛瘀生新
硒是人体必需的微量元素,具有抗氧化、防癌抗癌、解毒排毒、提高机体免疫力等重要功能,维持机体适量的硒摄入能预防多种疾病。然而因全球普遍缺硒,膳食补硒已成为共识。富硒苹果
命名实体识别是一项从非结构化大数据集中抽取有意义的实体的技术。命名实体识别技术有着非常广泛的应用,例如从轨道交通列车产生的海量运行控制日志中抽取日期、列车、站台
借贷型众筹是现代信息技术驱动下的重要金融科技活动之一。借贷型众筹中的投资者和借款者通过借助在线平台完成在线借贷交易。尽管近年来借贷型众筹的实践活动在全球范围内快
本文简要分析了游戏教学法应用于师范院校武术教学的必要性,提出了游戏教学法在设计游戏时应注重游戏的吸引力和合理性,以便于实现兼顾教学和娱乐的目的,又是一种有效的课前