【摘 要】
:
随着多媒体信息的迅速发展,越来越多的语音数据开始出现在人们的日常生活中,语音信息检索技术应运而生。在对这类语音信息检索的查询请求可以通过文本或语音输入方式完成。本
论文部分内容阅读
随着多媒体信息的迅速发展,越来越多的语音数据开始出现在人们的日常生活中,语音信息检索技术应运而生。在对这类语音信息检索的查询请求可以通过文本或语音输入方式完成。本文研究了一种通过语音输入查询的方式来检索语音文档的系统,即语音到语音的检索。本文所研究的语音到语音的检索系统可以分为语音识别系统和信息检索系统两部分。对于语音识别系统,本文利用开源工具HTK搭建了一套以汉字音节为基本单位的语音识别系统,并从语言学模型中平滑算法的角度,将SGT (Simple Good-Turing)的平滑思想和Katz算法结合,提出了一种改进的Katz算法,从而提高了语音识别系统的正确率。对于信息检索系统,本文采用目前应用最为广泛的向量空间模型(Vector Space Model, VSM)检索技术,利用词频(Term Frequency, TF)和倒转文档频率(Inverse Document Frequency, IDF)来构建词项索引,对比了在语音识别结果为One-best和音节网格(Lattice)两种形式下的平均检索正确率,并研究了音节网格中声学得分对检索系统正确率的影响。实验表明,语音检索系统的正确率很大程度上取决于语音识别系统的正确率。基于Lattice的语音检索系统能减小语音识别系统的误识率带来的影响,其平均正确率比One-best的情况下提高了5.54%左右。
其他文献
高中物理作为一门重要的学科,在高中各门课程中占据重要地位。物理能够启发学生的想象力,能有效地培养学生的逻辑思维。同时,在素质教育的大背景下,高中物理教学更是承担着素质教育的大任,其教学目的是使物理知识、观念和思维方法等在人才培养中发挥更大的作用。然而受各因素的影响,目前高中物理教学中普遍存在课堂氛围枯燥,学生厌烦上物理课,教学效率低下等问题。本文就高中物理教学所得,具体分析高中物理教学中存在的一些
<正>尽管樱桃木的细腻结构与其清晰的木纹相结合,所表现出的是一种典型朴实无华的木材品质,但是,却由此而产生了一种以樱桃木为代表的特种木材的概念。
盛夏的骄阳下,喝上一杯新鲜的鲜榨果汁是一件惬意的事。随着气温升高,商场和街边冷饮店鲜榨果汁的生意也越来越红火。然而有业内人士说,街头果汁店出售的很多鲜榨果汁是由劣质浓
随着素质教育的全面推进,课程实验的深入开展,语文教学研究迈入了新的阶段。提高学生全面素质的探索不断走向深入的同时,从小培养学生文学素养,也应成为语文教学活动中必不可少的内容。让学生能初步理解、鉴赏文学作品,受到高尚的情操与趣味的熏陶,丰富精神世界。要提高全民族的文学素养,应该从小抓起,积极引导学生较多地接触我国文学宝库中的经典作品,从中汲取丰富的养分。而文学素养的提高应着眼于从课堂教学延伸到课外阅
鸽子兰,简称鸽兰,又名鸠柱兰、圣灵兰花,兰科鸽兰属多年生大型落叶草本植物,是生长在中美洲的哥斯达黎加、巴拿马、哥伦比亚、厄瓜多尔及委内瑞拉的一种地生兰,它们野生在热
从本体论看,"中国模式"是客观存在的;但从认识论看,"中国模式"尚在建构之中。"实例的总和"表明我们只是认可而非认识了"中国模式"。学界应对"中国模式"多作形而上的探究,藉以实现由本体