基于鉴别性向量空间模型的语种识别

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:jsyzcqg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统语种识别中训练数据库的规模庞大,对于语种分类有鉴别性的信息大量重叠,且训练数据的不同信道条件、不同来源都会对训练和测试有一定干扰。针对这些问题,提出一种鉴别性向量空间模型(D-VSMs)建模方法。D-VSMs能够自动过滤训练集中信息重叠的数据,使得每一个支持向量机的训练数据都有针对性,从而用较少的训练数据能取得较好的分类效果。在美国国家标准技术局(NIST)2009年语种识别测试中,D-VSMs只用了原训练数据的25%,计算量是传统并行音素识别器后接向量空间模型(PPRVSM)的10%,等错误率在30s、10s和3s的测试条件下分别比传统PPRVSM下降了12.75%、15.89%以及7.33%。 Traditionally, the scale of training database in traditional language recognition is large, there is a great deal of overlap of discriminative information for language classification, and different sources of training data have different interference to training and testing. To solve these problems, a discriminative vector space model (D-VSMs) modeling method is proposed. D-VSMs can automatically filter the data of overlapping training information, so that each SVM training data is targeted, so that less training data can get better classification results. D-VSMs used only 25% of the original training data in the NIST 2009 Language Recognition Test, which calculated at 10% of the traditional parallel vector space model (PPRVSM) of the phoneme recognizer The error rate decreased by 12.75%, 15.89% and 7.33% respectively compared with the conventional PPRVSM under the test conditions of 30s, 10s and 3s.
其他文献
致癌性三十年代前后,报道了德国和瑞士的重铬酸盐生产工人首批肺癌病例。从早期在美国和英国所进行的数次流行病学调查结果来看,铬酸盐和铬颜料生产工人的肺癌病例确有增多,
  Recently,several new prenyltransferases structures that contain a triose phosphate isomerase (TIM)barrel fold have been discovered,and there is considerable
会议
  生物反应过程是细胞生理代谢的复杂过程,其过程优化放大的研究已由过去的细胞外反应器环境条件优化,深入到了细胞内的分子生理特性研究,研究者建立了生物过程现象与菌体生理
名噪一时的华威先生,消声匿迹近半个世纪后,又以新的面目,历史性地出现了。传说,他一月以前,还登门拜访了给他作过传记的著名作家张天翼。据目击者云,华威先生仍是当年容貌,
  CDT-1 and CDT-2 are cellodextrin transporters cloned from Neurospora crassa.CDT-1 has shown good potentials in cellulose based chemical and biofuel producti
会议
  本文通过比较棉纤维织物、聚乙烯醇柱体、活性炭颗粒吸附所筛选的Clostridium butyricum 厌氧条件下将甘油转化为1,3-丙二醇的有效性,选择活性炭作为固定化丁酸梭菌的较
会议
夏新DLP光显星钻背投作为画面显示性能卓越,价格却相对优惠的最新高端数字电视,也已开始全面入驻主要的家电连锁店和家电卖场,为消费者提供高性价比的购机选择。夏新52英寸DL
近年来,由于一些新疾病的发生和细菌耐药性的出现,微生物来源次级代谢产物的筛选重复率越来越高,微生物一些代谢基因在现有实验室条件下无法表达,所以需要发现新的微生物资源
数学是小学阶段非常重要的一门学科,这门课程具有非常强的逻辑性和抽象性,对提升学生的解题能力和创新能力有非常重要的作用.学生的逻辑思维需要从小就开始培养,逻辑思维能力
  针对目前植物油精炼过程酸化脱磷脂过程存在的用酸、用碱和能耗高等问题,开展了产磷脂酶菌株的筛选和磷脂酶脱胶机理的研究,发展并优化了磷脂酶B脱胶新技术,取得了脱胶效果