搜索日志中“V+N”、“V+V”型短语识别

来源 :北京信息科技大学学报:自然科学版 | 被引量 : 0次 | 上传用户:wa0001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从搜狗日志语料出发,分析语料特点,以词语本身、词性信息、位置信息、查询词串频次和音节数为特征,提出了基于SVM_HMM模型的短语自动识别方法,对"V+N"、"V+V"短语进行多重对比实验,实验验证了上下文信息量的增加能提高短语识别效率,证实了音节数、位置特征对实验效果的低影响力,为搜索引擎用短语词典的构建提供技术支持,为进一步的短语类别识别研究提供方向性指导。
其他文献
结核性脑膜炎是结核杆菌引起的脑膜非化脓性炎症,可继发于粟粒性肺结核及其他器官的结核病灶[1]。一般起病缓慢,早期可见结核病的一般中毒症状,如:发热、盗汗、食欲减退、消瘦
根据小波变换原理,采用db1小波基函数,对人脸图像进行3级小波分解。将3层小波近似分量进行重组,得到新的样本向量集。由于非参数鉴别分析对非高斯分布样本集具有良好的适应性,提出了基于小波近似分量和非参数鉴别分析的人脸识别算法。在样本向量集上应用非参数鉴别分析,形成类内和类间矩阵,然后利用Fisher线性鉴别进行人脸识别。实验结果表明,在ORL和CAS-PEAL-R1人脸库上使用上述算法的识别率分别为
基于模式信息系统总体设计方法,开发了与其相对应的应用系统,并对该系统的功能结构、数据库设计、基于SOM网络的模式生成和基于BP网络的模式实例化设计及实现过程进行了详细介
基于线性振动理论建立了重型载货汽车转向前轴动态特性分析的有限元方模型,计算了前轴的模态参数,分析了其模态特性,计算了正弦交变载荷作用下前轴关键部位的动态应力值,用s—N曲