Web新闻语料分词和标注错误分析

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zj5536
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过分析Web突发事件语料库文本的加工统计得出11类错误类型,并对其中的一些错误提出了解决方案。研究结果不仅对语料库加工初期分词、标注方法的改进有启发作用,而且对中文的自动校对方法,提供一定的借鉴。
其他文献
1921年到2011年.是中华民族发展史上不凡的90年.伟大的中国共产党穿越血与火的历史烟云.历经建设与改革的洗礼。迎来了她的90华诞。我国林业在党中央、国务院的关怀下。在地方政
目的 探讨脑立体定向技术在颅内囊性病变中的应用。方法 采用螺旋CT引导立体定向手术23例,包括脑脓肿、蛛网膜囊肿、透明隔囊肿、囊性胶质瘤及颅咽管瘤。结果 23例手术均准确
目的探讨X-治疗胶质瘤后放射性坏死貌似肿瘤复发的临床表现与影像学特点.方法回顾性分析7例因胶质瘤而首选X-刀治疗后疑似肿瘤复发再行手术治疗,病理结果证实为放射性坏死病
目的普通MR已开始用于大鼠颅内肿瘤显像研究,对小鼠仍有困难.本研究探讨1.5T MR机能否用于小鼠颅内植入物的显像研究.方法立体定向下将不同剂量的显像剂钆喷酸葡胺和脑组织染
由正硅酸乙酯(TEOS)和甲基三乙氧基硅烷(MTEOS)出发,先构建了聚合物的单体模型,再构建单链,最后通过手动建立化学键的方法构建了有机硅树脂交联体系的网络模型,并且验证了该模型
商空间理论是研究不同粒度世界的一种新的数学工具。它用三元组(X,f,T)描述一个问题,其中X表示问题的论域,f(·)是论域属性,T是论域的结构。通过分析求解问题(X,f,T),对论域X及
报道10月10日至11日,“人造板行业可持续发展国际研讨会”在陕西杨凌召开。国家林业局原总工程师、中国绿化基金会副主席兼秘书长卓榕生,中国林业产业协会副秘书长、中国林产
难治性癫痫术后合理应用抗癫痫药物,是确保手术疗效和提高病人预后的重要因素。合理应用抗癫痫药物包括术后用药原则、何时减药、何时停药、及其注意事项。围手术期需要加大抗
提出一种基于方向可变滤波器的平面物体射影不变性识别方法。该方法首先利用方向可变滤波器检测出平面物体的边缘方向特征,从单幅图像中提取平面物体在射影变化下的不变特征,建立经典框架,然后用填充经典框架图像的矩识别物体。该方法是图像局部识别方法,允许景物中有部分的遮挡物存在。
目的探讨病灶性癫痫的手术方法,并分析影响手术预后的一些因素.方法回顾性地分析自2001年4月~2003年4月之间在我研究所接受手术治疗的所有病灶性癫痫患者的临床资料.33例患者