搜索引擎日志中"N+V"和"N1+N2+V"型短语自动识别

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:lionpb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
正确识别搜索引擎日志中的短语,对搜索引擎用短语词典构建和提高搜索引擎性能具有重要的作用。该文提出一种应用条件随机场实现对搜狗日志语料中“N+V”和"N1+N2+V"型短语自动识别的方法。模型的特征集包含词、词性和词语长度。由人工设计候选特征集,从中选择有效的特征构成特征模板,训练生成用于短语自动识别的条件随机场模型。封闭测试和开放测试的实验结果表明,模型能够实现对这两种短语的有效识别。关键词:条件随机场模型;搜索引擎日志;“N+V”型短语;"N1+N2+V"型短语;特征模板
其他文献
音乐欣赏课是中学音乐教学的重要组成部分。初中学生正处于需要去学会感知欣赏事物的成长阶段,是人生观价值观成长的关键时期。所以,教师在中学音乐课堂的教学过程中应该注重
蛋白多肽二级结构的电脑预测表明,非洲猪瘟病毒j5R阅读框编码12.9kDa膜蛋白。该蛋白的C末端含有一个潜在抗原决定簇,针对其合成肽的抗体能在ASFV感染细胞和病毒颗粒中检测到23或25kDa特异蛋白。免疫荧
丁型肝炎病毒(Hepatitis delta virus,HDV)是一种缺陷病毒,必须在嗜肝DNA病毒的辅助下才能复制并组装成有感染的病毒颗粒[1].
一位好朋友形容她是“坚强细心的剑兰”,重情多义是这位生于潇湘、长于潇湘的美女老总的灵魂和本质。“吃得苦、耐得劳、不信邪、能吃亏”在她身上淋漓尽致得展现出湖南人的特
采用HGVNS5特异的2对引物,对两个香港株和一个广东株HGV-RNA进行逆转录套式PCR扩增,PCR产物克隆入PUC19,重组质粒转化DH5α和JM109菌株。PCR和酶切法鉴定阳性克隆,双脱氧链末端终止法测定核苷酸序列进行同源性分析。
本刊今年第 2期转载了毛江森院士的一篇短文 ,题目是《建议将Prion的中文名定为“朊毒”》。笔者认为Prion的中文译名仍应以在国内已被较广泛采用的“朊病毒”为好。现提出以下三条理由
对棉铃虫单核衣壳核多角体病毒(Helicoverpa armigera single-nucleocapsid nucleopolyhedrovirus,HaSNPV)基因组中EcoRI-N片段进行序列分析,获得了完整的解螺旋酶基因(hel),
构建了猪瘟(classical swine fever virus,CSFV)主要保护性抗原E2基因4种不同的真核表达质粒。小鼠免疫试验表明,E2基因上不同的功能区对基因疫苗的免疫应答有很大影响,有信号肽序列的E2基因可诱导产生特异性免疫反
该文对近年来统计机器翻译研究中出现的多种一致性解码方法进行比较与分析。根据现有一致性解码方法对(单个或多个)统计机器翻译系统输出结果使用方式的不同,首先将其归纳为两大
建立了检测番木瓜环斑病毒(PRV)的免疫捕捉-PCR(IC-PCR)法、ELISA-PCR法和巢式-PCR法,它们分别能从10^-4、10^-7和10^-14稀释度的番木瓜叶粗汁液(所含鲜叶组织的量分别0.5ug、0.5ng和5×10^-6ng)中检测出PRV。