中文微博命名实体识别

来源 :计算机科学 | 被引量 : 0次 | 上传用户:kaiyuanwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博这一媒体形式的迅速发展为命名实体识别提供了一个新的载体。根据微博文本的特点,提出针对中文微博的命名实体识别方法。首先,对微博文本做规范化处理,消除由于微博表达不规范造成的干扰;在建立中文人名库、常用地点库等知识库的基础上,选取适合微博的特征模板,使用条件随机场方法进行实体识别;同时,将正确的识别结果添加到知识库中以提升识别效果。在真实微博数据上的实验表明,该方法能够有效地完成中文微博的命名实体识别任务。
其他文献
针对学生入学时英语水平客观存在上的差异,按照因材施教的原则实施大学英语分层教学势在必行。本文分析了孝感学院近年来进行的大学英语分层教学模式的探索与实践,全面总结了
我国目前对证券交易异常情况处置的制度规定存在着明显的缺失。因重大差错而产生的交易异常情况还未正式纳入法律制度框架,暂缓交收的处置措施缺乏完整的制度设计,而撤销交易
碳排放权是在以《联合国气候变化框架公约》和《京都议定书》为核心的国际法律体系下产生的新型权利,该权利具有准物权属性和发展权属性,而这两方面属性的关系是辩证统一的。
<正>自2005年设立浦东综合配套改革试点以来,上海市委、市政府一直将科技金融体制改革作为试点工作的重要内容。经过8年多的改革探索,浦东新区以制度优势集聚创新资源、撬动
带式输送机盘式制动时会产生剧烈的不稳定冲击,为此研究电液比例溢流阀调速系统。采用AMESim软件建立仿真模型,分析并优化了不同口径的电磁溢流阀的流量变化,分析了制动系统
<正> 0 引言 TCP是目前Internet中广泛采用的一种传输控制协议,为各主机之间提供可靠按序的传输服务。TCP拥塞控制机制是其成功应用于Internet的关键所在。TCP拥塞控制机制主
解构我国检察机关刑事审判监督职能表明,三种行使方式都系诉权范畴,即属诉讼职能。其中,向法院提出"纠正意见"名不副实,实为一种异议;抗诉案件改判比例极低,与检察机关"在刑
本文讨论了GM(1,1)预测模型初始条件取值存在的问题.从GM(1,1)预测模型的建模机制出发,找出该问题存在的根本原因,并从使模型拟合误差平方和最小的角度出发,提出一种新的初始
在此次《刑事诉讼法》修改中,审前阶段刑事法律援助制度的确立是一大进步,但对此只能保持审慎乐观的态度:一方面,在吸纳现行法规和司法解释的合理化内核基础上,新法确认了申
作为公民的基本人权,自我决定权的解释力辐射到被害人同意、被害人自陷风险、诈骗罪中的被害人怀疑与错误、自诉以及刑事和解等诸多刑事法领域。家长主义是自我决定权在刑法