基于CRF的百科全书文本段落划分

来源 :计算机工程 | 被引量 : 0次 | 上传用户:allen75
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
CRF模型是标注、切分序列数据的较新的概率模型,在信息抽取等文本处理领域广受关注。该文介绍了CRF方法,并将共应用到百科全书文本段落的划分上,利用CRF的特征表述机制加入了文本单元序列中的长距离约束,取得了比传统的隐马尔科夫方法更好的结果。
其他文献
我国的关联交易问题是伴随证券市场的发展而提出的。它与初步发展的中国资本市场和以股份制改造为核心的企业改制存在着天然的联系。中国的公司治理、经济体制和不完善的法律
全国脱贫攻坚总结表彰大会在京隆重举行2月25日,全国脱贫攻坚总结表彰大会在北京人民大会堂隆重举行。中共中央总书记、国家主席、中央军委主席习近平向全国脱贫攻坚楷模荣誉
社会凝聚力是维系国家统一和社会团结的纽带,也是社会和谐的重要指标。社会凝聚力越强,人与人之间的使命感和团结合作精神越强,该社会的和谐程度越高。社会转型时期,我国的社
提出了建立检测技术数据库的方法,介绍了软件的结构及功能,为检测技术更好地服务提供一个基础数据平台.
教学反思是教学过程的重要环节。做好教学反思有助于提高课堂活力和教师自身教学水平。本文通过分析初中地理教学中遇到的种种问题,展现地理教学反思给地理教学带来的生机和
目的 探讨苯妥英钠中毒的临床特点、诊治方法、误诊原因及防范措施.方法 对曾误诊的苯妥英钠中毒1例的临床资料进行回顾性分析,并复习相关文献.结果 本例因头晕、步态不稳5 d
目的:分析应用新型敷料联合小切口对口引流在糖尿病足感染溃疡中的干预效果。方法:2018年1月-2020年1月收治糖尿病足感染溃疡患者86例,随机分为两组,各43例。试验组接受新型
指出了UML的多视图模型存在缺乏统一语义模型的不足,提出了一种利用面向对象Petri网(OOPN)统一描述面向对象系统结构和行为模型的解决方法,即可执行对象结构模型(EOSM)。该方法将
组播路由协议HBH具有良好的可扩展性且内存需求低,但其对路由路径变化的适应能力及本地组播效率有待改进。该文分析了HBH协议产生上述问题的原因,提出新的组播转发树构建方式,通
文中介绍了以采集卡为测量手段,由交流电流源、测量系统、电流源保护系统和补偿系统组成的高温超导带材/磁体交流损耗测试系统。测试系统将功率补偿技术、电感补偿技术应用于