基于iOS系统的语音云开放平台客户端SDK的设计与实现

被引量 : 3次 | 上传用户:qiuzhizhedetiantang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在智能手机与智能平板等移动终端高度普及的今天,移动互联网飞速发展,移动终端应用对文字输入的要求也变得越来越高,导航类、聊天类等应用更是希望通过语音识别技术解放用户双手进行文字输入。随着iOS设备上Siri平台的日渐成熟,各大互联网公司也相继推出了自己的语音识别系统,但就目前来看iOS系统还未能给开发者提供公共的Siri API来调用语音识别功能,而各大互联网公司对客户端语音识别SDK又有严格限制,iOS系统缺乏通用的开放的语音识别SDK供开发者使用。本文主要研究了目前在iOS系统上可用的开放语音识别SDK,对比各语音识别SDK的产品功能,分析开发者对语音识别SDK的需求,提出了一整套新的解决方案来实现客户端语音识别SDK,全称为语音云开放平台客户端SDK,简称语音云SDK。语音云SDK使开发者可以轻松地在iOS设备上构建功能完备、交互性强的语音识别应用程序,在整个开发和使用过程中,开发者无需维护语音引擎即可享有语音识别服务。本文在软件工程思想的指导下,按照软件开发的过程,逐步实现语音云SDK系统。首先在了解了语音识别服务器端的基本流程,结合用户对语音识别的使用习惯,提出了语音云开放平台客户端SDK的需求,需求分析主要列出了语音云SDK给用户提供的功能以及语音云与服务器交互需要实现的功能。在详细的需求分析后对语音云SDK进行了详细地设计,设计过程中将整个语音云SDK按照功能分成了几个主要模块,分别为:录音模块、有效声音检测模块、音频压缩编码模块、网络收发模块以及识别结果回传模块等,并详细地列举了各个模块内的参数和方法,最后通过图表解释了各模块之间的工作流程以及交互关系。接下来根据设计进行了代码实现,代码实现的过程是按照音频数据在各模块中的流程顺序分先后实现。最后对整个语音云SDK进行了系统化的软件测试,并通过软件测试进一步完善了整个语音云SDK的可用性和安全性。
其他文献
建构主义理论的出现纠正了过去人们以现实主义为中心的国际关系史观。本文用现实主义理论与建构主义理论相结合的新视角来分析战后日本与美国的关系和近年来中日关系的复杂变
伴随着经济的快速发展,我国的改革获得了进一步深化,社会的变革导致出现了一系列社会现象,其中基层人民法院案件增多就是比较典型的社会现象。案件增多与基层法院法官队伍资
目的观察中西医结合治疗外阴白斑病的临床疗效。方法选择外阴白斑病患者62例,通过计算机随机分组的方式将其分为观察组和对照组,每组患者31例。观察组患者给予内服中药汤剂+
波动方程反演问题在许多领域中具有广泛应用,它面临非线性、不适定性和计算量巨大的问题。针对波动方程反问题的特点,以二维波动方程反问题为数学模型,通过利用地震资料和测
杏鲍菇是我国食用菌工厂化栽培的主要种类,与其它菇类相比,杏鲍菇对环境条件较为敏感,而环境条件又是影响产量和品质的关键因素。目前,人们对杏鲍菇适宜环境条件的研究主要集中在
联合站是油田原油集输和处理的中枢,介绍了基于西门子PLC的联合站数字化监控系统的系统构成、集成实现及系统功能,阐述了数字化在油田联合站建设中的应用效果和意义。
采用改进的方法直接测定了芳香硝基化合物与多硫化钠在反应过程中的紫外光谱的变化。通过测定不同温度、不同浓度多硫化钠、DMF以及其它衍生物对反应影响的紫外光谱变化,进一
对策论主要研究策略选择问题,强调的是个人理性。纳什均衡在非合作博弈理论中起着核心作用,但其均衡的多重性限制了纳什均衡的应用。就纳什均衡的经济含义及多重均衡的效率选
本文对权力转移理论加以扩展,区分实力与政治权力,并探讨了全球层级体系和区域层级体系并存的情形。借助这一扩展的权力转移理论框架,本文分析了20世纪80年代以来东亚的实力
目前,全球IPv4网络地址的资源分配已经告罄,而全面部署架设IPv6网络又需要花费相当长的时间以及大量的设备,我国的网络环境将长期处于IPv4网络和IPv6网络并存的现状。于此同