领域问答系统中的文本错误自动发现方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:lizhigang3637
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本自动校对是自然语言处理的一个挑战性的研究课题,也是一个难题。该文对中文的错误类型和原因进行分析,提出了一种基于领域问答系统用户问题日志的错别字自动发现方法。该方法首先对语料进行分词,然后对分词的结果中出现的散串进行合并,对分词中的多字词和合并的串进行相似词串聚类,对相似词串的上下文语境进行统计分析,从中自动获取错别字对。实验表明,该系统获得71.32%的召回率,82.6%的准确率。
其他文献
清乾嘉间,朴学鼎盛。仪征阮芸台以懿文硕学颉颃诸公,而久历仕,为高官,故所至每乐以其力提挈风雅,宏扬学术,影响所及,蔚然成风。任浙江学政时,尝策群力成《经籍籑诂》百余卷,盖本吾华语言音义相通之理,辑训诂之见于故书雅记者,依韵编之。既便读者之检索,而音韵训诂一以贯之之理,亦由是而益明,其一事也。其书行世垂二百载,学者至今利赖之。然以创制伊始,周浃维艰,其条理未尽当,资料未悉备.或编次失照,或引据有误,亦所未免。流传既久,阙失愈显,世之通人,每思所以更张之。始我亲教大师蕲春黄君
<正>8月2日,国家电网公司与中国信息安全测评中心签署了&#39;战略合作框架协议&#39;。此次合作对加快推进国家电网信息安全建设,维护国家安全具有深远的意义。国家电网公司,
期刊
论志怪三体陈文新从汉至唐,志任长期隶于史部,直到宋欧阳修等纂《新唐书·艺文志》,才将其归属于子部小说家类。从渊源上看,志怪小说的确是从史书中分化出来的。刘知几《史通·书
【正】2010年1月22日证监许可[2010]115号国元证券股份有限公司:你公司报送的《关于袁晓明注册为保荐代表人的申请报告》(国证人字[2009]454号)及相关文件收悉。根据《证券法
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
【正】安信证券股份有限公司:你公司报送的《关于仇智坚注册为保荐代表人的申请报告》(安证报[2010]120号)及相关文件收悉。根据《证券法》、《证券发行上市保荐业务管理办法
文章对美国AE-31型Aethalometer在线测量环境大气的黑碳仪器进行了介绍,并对仪器在运行过程中,出现的故障及排除方法做了总结.
沈阳市南北快速千道北二环至北三环第四标段A匝道第三联钢箱梁跨越望花北街,望花北街车流量非常大,架设期间遇到了一系列困难,文章总结出切实可行的铜箱梁架设施工方案,达到了预
近年来外国游客争相前来中国旅游,因此景区简介翻译必须地道而不失本国文化内涵。本文以广州白云山风景区简介为例,分析景区简介翻译策略,为日后景区介绍翻译提供借鉴。