基于鉴别性向量空间模型的语种识别

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户：jsyzcqg

【摘要】

：

传统语种识别中训练数据库的规模庞大,对于语种分类有鉴别性的信息大量重叠,且训练数据的不同信道条件、不同来源都会对训练和测试有一定干扰。针对这些问题,提出一种鉴别性

【作者】

：

刘巍巍张卫强刘加

【机构】

：

清华大学电子工程系,清华信息科学与技术国家实验室,

【出处】

：

清华大学学报(自然科学版)

【发表日期】

：

2013年06期

【关键词】

：

向量空间模型鉴别性训练数据语种识别信息重叠识别系统训练语料语音段美国国家标准识别器

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

传统语种识别中训练数据库的规模庞大,对于语种分类有鉴别性的信息大量重叠,且训练数据的不同信道条件、不同来源都会对训练和测试有一定干扰。针对这些问题,提出一种鉴别性向量空间模型(D-VSMs)建模方法。D-VSMs能够自动过滤训练集中信息重叠的数据,使得每一个支持向量机的训练数据都有针对性,从而用较少的训练数据能取得较好的分类效果。在美国国家标准技术局(NIST)2009年语种识别测试中,D-VSMs只用了原训练数据的25%,计算量是传统并行音素识别器后接向量空间模型(PPRVSM)的10%,等错误率在30s、10s和3s的测试条件下分别比传统PPRVSM下降了12.75%、15.89%以及7.33%。 Traditionally, the scale of training database in traditional language recognition is large, there is a great deal of overlap of discriminative information for language classification, and different sources of training data have different interference to training and testing. To solve these problems, a discriminative vector space model (D-VSMs) modeling method is proposed. D-VSMs can automatically filter the data of overlapping training information, so that each SVM training data is targeted, so that less training data can get better classification results. D-VSMs used only 25% of the original training data in the NIST 2009 Language Recognition Test, which calculated at 10% of the traditional parallel vector space model (PPRVSM) of the phoneme recognizer The error rate decreased by 12.75%, 15.89% and 7.33% respectively compared with the conventional PPRVSM under the test conditions of 30s, 10s and 3s.

其他文献

铬的致癌性和诱变性

致癌性三十年代前后,报道了德国和瑞士的重铬酸盐生产工人首批肺癌病例。从早期在美国和英国所进行的数次流行病学调查结果来看,铬酸盐和铬颜料生产工人的肺癌病例确有增多,

期刊

诱变性致癌性生产工人铬酸锌平均潜伏期重铬酸盐铬颜料铬酸铅流行病学调查铬酸盐

Insights into TIM-barrel Prenyl Transferase Mechanisms: Crystal Structures of MoeO5 and PcrB

　　Recently,several new prenyltransferases structures that contain a triose phosphate isomerase (TIM)barrel fold have been discovered,and there is considerable

会议

基于生理特性和流场特性相结合的生物反应过程优化放大原理与实践

　　生物反应过程是细胞生理代谢的复杂过程，其过程优化放大的研究已由过去的细胞外反应器环境条件优化，深入到了细胞内的分子生理特性研究，研究者建立了生物过程现象与菌体生理

会议

生理特性流场特性生物反应过程过程优化放大生物过程生理代谢细胞外

华威先生寻访记

名噪一时的华威先生,消声匿迹近半个世纪后,又以新的面目,历史性地出现了。传说,他一月以前,还登门拜访了给他作过传记的著名作家张天翼。据目击者云,华威先生仍是当年容貌,

期刊

蹈袭覆辙张天翼登门拜访景色宜人善谋洗手盆二字议而不决荒唐事参加会议者

CDT-2 of Neurospora crassa is an all-round transporter for both cellodextrin and xylodextrin, reveal

　　CDT-1 and CDT-2 are cellodextrin transporters cloned from Neurospora crassa.CDT-1 has shown good potentials in cellulose based chemical and biofuel producti

会议

固定化细胞厌氧转化甘油制备1,3-丙二醇

　　本文通过比较棉纤维织物、聚乙烯醇柱体、活性炭颗粒吸附所筛选的Clostridium butyricum 厌氧条件下将甘油转化为1,3-丙二醇的有效性,选择活性炭作为固定化丁酸梭菌的较

会议

发布特区

夏新DLP光显星钻背投作为画面显示性能卓越,价格却相对优惠的最新高端数字电视,也已开始全面入驻主要的家电连锁店和家电卖场,为消费者提供高性价比的购机选择。夏新52英寸DL

期刊

数字电视刷新频率画面显示优派色轮夏新图像清晰度画面表现宽屏拖尾

海洋动物来源微生物的共培养研究进展

近年来,由于一些新疾病的发生和细菌耐药性的出现,微生物来源次级代谢产物的筛选重复率越来越高,微生物一些代谢基因在现有实验室条件下无法表达,所以需要发现新的微生物资源

期刊

海洋动物微生物共培养次级代谢产物

小学数学微课教学探究文

数学是小学阶段非常重要的一门学科,这门课程具有非常强的逻辑性和抽象性,对提升学生的解题能力和创新能力有非常重要的作用.学生的逻辑思维需要从小就开始培养,逻辑思维能力

期刊

小学数学微课教学

磷脂酶B与植物油脂脱胶

　　针对目前植物油精炼过程酸化脱磷脂过程存在的用酸、用碱和能耗高等问题，开展了产磷脂酶菌株的筛选和磷脂酶脱胶机理的研究，发展并优化了磷脂酶B脱胶新技术，取得了脱胶效果

会议

磷脂酶植物油脱胶效果脱胶机理强化过程精炼过程过程存在新技术

基于鉴别性向量空间模型的语种识别

与本文相关的学术论文