人机共赢中文分词全正确:谈交集型歧义字段的处理(英文)

被引量 : 0次 | 上传用户:sddhyyj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
书面英文词与词之间用空格分开,而中文却没有词之间的边界标记。因此,词切分成了中文信息处理的一个基础工程。中文的计算机分词研究一直都在力图实现全自动和高质量。但是要确保自动分词的百分之百正确,计算机就得完全理解每个句子的意思,而这是难度更高的一项工作。我们正在研制一个能方便用户提供必要帮助的分词软件,有三种输出模式:中文词切分,英文翻译和双语词对照,以便中英文读者检查校对分词结果。中文词切分的主要问题在于交集型歧义字段的处理。我们做了一个涵盖34篇新闻文章的实验,结果交集型歧义字段识别的正确率和召回率都达到100%。在这些字段的词切分方面,首选切分正确率81.29%,而且所有错误切分在次选切分中都得到更正,方便读者选用。
其他文献
题目在AABC中,点D在边BC上,且DC=2BD,AB:AD:AC=3:k:1,则实数k的取值范围为直角坐标系,由题意,
针对高速高加速度的平面并联机构,采用面向控制系统的机构设计方法,对机械结构进行优化设计.分别在运动学、动力学层面上提出多个性能指标,以其作为目标函数和约束条件建立了标准
从对比语言学的角度,对悉心挑选的7对具有代表性的英汉修辞格进行对比分析,据此证明幽默诙谐是这些修辞格所共同具备的一种突出的修辞效果.
目的:探讨颌面部肿瘤DSA表现、术前暂时性栓塞和永久性栓塞的治疗效果及并发症.材料与方法:采用Seldinger's法,对20例颌面部肿瘤进行DSA造影,其中13例施行了术前暂时性栓
上海市加快建设国际文化大都市,将影视产业作为重点发展领域之一,在上海西南郊区松江发展大型高科技影视基地。在上海松江科技影都的规划实践中,通过分析影视产业的内涵与发