语音识别在多媒体播放器中的设计与实现

被引量 : 0次 | 上传用户:ekinhushuang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。随着科技发展和人们生活水平提高,多媒体播放器已经在市场上得到了极大的推广,将语音识别技术应用于多媒体播放器具有重大的意义。论文的目的在于设计一个带语音识别功能的高清多媒体播放器,对语音识别算法进行研究分析并提出改进措施,算法源码可以很方便的移植到其他嵌入式设备上,对后续语音识别技术的研究、改进及应用有着重大的意义。论文对多媒体播放器进行了硬件和软件设计。主控芯片采用全志公司研发的以ARM926EJ-S为内核的F15芯片,硬件电源管理模块使用了高度集成的电源系统管理芯片AXP188。对多媒体播放器的GUI系统进行了设计与实现,在此基础开发了音乐、电影等多媒体应用程序。在多媒体播放器中设计并实现了孤立词语、非特定人的计算机指令语音识别系统。论文深入研究并分析了在语音识别过程中使用到的各种算法理论,在对比分析中选择了适合嵌入式多媒体播放器应用的算法。选用基于短时过零率和短时能量的双门限比较法作为语音端点检测算法;选用MFCC(Mel频率倒谱系数)作为语音的特征参数,在特征参数提取中使用高效率的基-4FFT快速傅里叶变换进行频谱分析;在语音模板库匹配阶段使用DTW(动态时间规整法)算法进行识别结果的判别。对双门限语音端点检测算法做了改进,有效地减少了指令被截断的现象。为了减少端点检测的误检率对最终识别效果的影响,对DTW算法做了一些改进。开发了语音识别应用程序,方便用户与多媒体播放器进行交互。经过系统测试,设计出来的多媒体播放器用户界面友好、美观,能流畅播放1080P电影、音乐、图片等多媒体文件,语音识别率高、实时性好,可以通过语音控制多媒体播放器进行电影播放、音乐播放、进入、退出等操作,验证了算法的可行性。
其他文献
目的:优化盆腔炎肛门栓的处方.方法:以硬度、均匀性及融变时限等为指标,以不同种聚乙二醇为主要基质制备的水溶性基质栓剂进行处方筛选.本实验通过采用正交设计实验筛选出合
目的:建立VX2肿瘤侵犯下腔静脉(IVC)的动物模型,并观察相应的生物学行为。方法:经腹直视下,将VX2肿瘤组织块分别种植在28只兔肾以下IVC附近的软组织内,然后随机分为A、B两组。A组术
应用关联规则的方法 ,通过对 32 1首白术方的数据挖掘试验 ,深入剖析了药物与药物、药物与证之间的关联 ,发现白术类方的药物配伍规律及白术的临床用药特点对大量白术方的方
运用文献综述法、问卷调查法以及数理统计法等相关研究方法,对游泳课在中职学校体育教学中的地位及作用进行调查与研究,目的在于对游泳运动在中职学校体育教学体系中进行合理
分子印迹技术是近年来迅速发展起来的一种先进的分子识别技术,利用分子印迹技术制备的分子印迹聚合物具有特异识别性能,可以有效地分离开分子结构类似的几种物质,因此,分子印
随着传播载体的日益完善,FLASH动画得到了多元化的发展,在FLASH动画创作中,色彩设定具有非常重要的作用,直接影响着动画作品的表现与传达,协调处理动画色彩,则需要进行大量的
本文从国家与社会的矛盾入手,通过互联网这一媒介,研究互联网的发展对公民社会建设的影响。把“网民—公民—公民社会”作为一个逻辑主线贯穿全文,结合中国特色社会主义建设的具
经过十多年的稳定快速发展,中国零售业的整体水平有了很大提高.2005年中国零售服务市场对WTO成员方全面开放,中国零售服务业面临着更大的机遇与挑战.研究了中国零售服务业开
文章以现代汉语中的限定范围副词“单、光、仅、只”作为研究对象,对它们的句法分布、与副词的共现情况、语义指向以及量级与非量级用法四个问题进行详细的讨论。虽然它们在句
本篇论文主要进行了以下几方面的研究分析:首先,随着社会的发展与素质教育的提升,中国独特的独生子女现象越来越引发了个性化教学的探讨。在个性化教学的理论基础上,课堂知识诊断