基于条件随机场与Web数据的缩略语预测

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:sukeyjuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
缩略语在自然语言中被广泛使用。因其是新词的重要来源之一,成为了自然语言处理领域的一大问题。该文以汉语为对象,研究了从完整形式预测缩略语形式的方法。首先,使用条件随机场模型对完整形式进行序列标注,生成缩略语候选集合。再利用搜索引擎获取网络数据,并通过不同策略利用网络数据对各候选依次评估,结合各项评估分数进行重排序,选择最终的缩略语结果。实验结果表明,增加Web信息之后,缩略语预测的准确率可以提高约五个百分点。
其他文献
木毒蛾核型多角体病毒属昆虫杆状病毒科,核型多角体病毒属,多粒包埋型。在扫描电镜下,多角体呈不规则多面体,大小不一,平均直径为1.40μm,病毒粒子杆状,大小约为394×56nm,经SDS-PAGE分析,病毒多角本蛋
应用电子显微技术研究人工感染的中国对虾病毒病原及其宿主细胞超微病量学变化。结果显示病虾体内存在球状与杆状两种病毒病原,有时在同一病虾组织的同一细胞中可见两种病毒同
社区问答系统已经积累了大量的以层次类别结构进行组织的问题答案对.为了能够重用这些非常宝贵的历史问题答案对资源,设计出一个非常有效的问题检索模型至关重要.在该文中,我
从印度木薯花叶病毒(ICMV)侵染的植物中纯化特异的核酸,经RNAasw,DNAase,Nuclease,ExonucleaseⅢ和EcoRI酶切,Southern和Dot blots杂交证实,在感病的植株中,存在两种形式的病毒核酸:环状双链DNA和环状单链DNA,后者可能是病毒DNA的(一)链,环状双链CNA经限制性内切
2014年10月18日至19日,第十三届全国计算语言学会议(CCL2014)在华中师范大学召开。会议主办单位是中国中文信息学会,组织单位是清华大学信息科学与技术国家实验室,承办单位是华中
故事中隐含着的“品德悟语”,告诉我们什么是好品德,如何在日常生活中塑造好品德,启迪孩子的心智,为孩子的成长提供必要的心灵养分。自品德与生活、品德与社会新课程确立以来
从病鸡肝分离到一株病毒,经电镜检查、理化特性分析、核酸电泳和中和试验等证明它为禽呼肠孤病毒(ARV)。该病毒只在鸡胚肝细胞(CELi)上产生细胞病变(CPE),在鸡胚成纤维细胞(CEF)和V_(ero)细胞上不增殖,它对热
为了解连云港海域贝类甲型肝炎病毒(HAV)污染状况,证实其在本地区甲肝传播中的媒介地位,我们应用抗体捕捉聚合酶链反应(AC/PCR)检测市售贝类的HAV,结果报告如下:材料和方法1贝类样品于1996年春、秋二季
采用固相法合成HIV-1和HIV-2两个多肽,建立了用混合多肽为包被抗原检测HIV-1和HIV-2感染的间接酶联免疫吸附法。检测46份抗HIV-1和HIV-2抗体阳性血清标本以及94份对照血清标本,与UBI试剂比较,其阳性符合率为97.8%,阴性符合率
1引言  高中的数学知识是基础数学,是数学大厦的根基,其中排列组合是独立的内容,也是重要的内容。在生产实践中,排列组合的知识也经常应用,比如,工作安排力的分工、选配等实际问题,用排列组合来解决将会得到更好的处理结果。  2排列组合的基本概念和计算公式  排列的定义:有n个不同元素,从中取出m个,按照顺序排成一列,叫做排列。  组合的定义:有n个不同元素,从中取出m个,组成一组,叫做组合。  排列数