基于三词位的字标注汉语分词

来源 :安阳师范学院学报 | 被引量 : 0次 | 上传用户:sust_alex
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
借助于统计语言模型将汉语分词转换为字序列标注并实现汉语分词已经成为近年来汉语分词的主流方法,但统计语言模型训练时间较长一直是这一方法中的最大问题。提出了一种基于三词位的字标注汉语分词方法,并在bakeoff2005提供的语料上进行了对比实验,结果表明该方法可以取得接近四词位字标注分词方法的性能,但在模型的训练时间上明显优于四词位标注方法。
其他文献
文章对钱锺书《诗可以怨》中各观点做了细致考察,针对"为文造情"问题,指出决定"穷愁"经历能否产生佳作的关键在于主体的表达能力,或曰表情达意的有效性;并指出"诗可以怨"与中
当大量世界知名工程机械设备制造企业进入国内市场,高新技术的应用离不开专业英语。工程机械行业的从业者不仅需要掌握大量专业知识和专业英语词汇,还应具备基本口语交流和书
阅读是增长知识、获取信息的主要途径,而快速阅读能力的培养一直以来都是大学英语阅读教学的重点。然而受传统阅读模式的影响,英语阅读效率低是整个大学生群体的普遍现象。笔
新的宪政体制的标志是新宪法秩序的形成.新宪法秩序不要求去关注"新政"时代的法院的判决.过去试图通过立法和司法判决来实现社会公正的努力在新宪法秩序中已不再重要.新宪法
欧盟的主流人权思潮是欧美中心主义或西方中心主义.中欧人权观的异同主要表现在人权的普遍性和特殊性,人权的内涵,对民主的理解,主权和人权的关系等方面.中欧双方在人权问题