多功能综合语音搜索引擎的设计与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wdongjiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通讯技术的飞速发展,生活中充斥着各种计算机变体,几乎人手一台智能手机。各种通讯软件成了我们日常社交中离不开的一部分,这些工具在帮助人们享受便捷快速交流的同时,也被一些不法分子利用,成为其实施违法犯罪活动、沟通联络、召集、串联的平台和工具。各种语音信息的处理也成了公安工作很重要的一部分,出现了越来越多需要识别和处理的语音信息。传统的人工处理方式需要耗费大量的人力和时间,已经无法处理庞大的语音数据资源。并且传统的处理方式难以对历史语音数据进行深度挖掘和综合搜索,容易出现重大信息和线索的疏漏。在充分了解和掌握工作的实际需求之后,结合现有语音资源库的特点,将语音识别前沿技术和搜索引擎技术进行融合,建立一套综合语音搜索引擎,将传统的人工识别方式转变为“智能搜索”,切实提高公安工作中语音数据处理的速度和精度。语音识别技术的日趋成熟以及工作中越来越多的语音信息的积累,为基于公安业务需求的多功能综合语音搜索引擎的出现提供了可行性和实验条件。主要工作如下:(1)首先,对工作中语音处理需求进行了详细分析。在充分了解了实际需求的基础上,提出了将主流语音识别技术和搜索引擎技术进行融合实现人工识别转变为“智能搜索”的整体思路。基于可扩展性和负载均衡的考虑,提出了包含语音分析子系统和搜索系统两大主要功能的分布式多功能综合语音搜索引擎的软件体系架构。(2)设计和实现语音分析子系统。对语音识别领域的主流技术:关键词识别技术、声纹识别技术、语种识别技术和性别识别技术进行整合,设计和实现了语音分析子系统,对采集到的语音信息进行实时分析,对语音中包含的说话人信息、语种信息、性别信息、关键词信息进行标注,既可以实现对包含敏感信息的语音实时报警,又为语音数据的综合检索利用提供可能。(3)利用搜索引擎技术,对语音中标注的说话人信息、语种信息、性别信息、关键词信息以及时间、来源、账号等信息建立基于倒排技术的索引。以实现对采集到的语音信息的全方位交叉式的智能实时侦控和语音数据挖掘的目的。(4)融合语音识别与搜索引擎技术,建立一套高性能多功能语音搜索引擎。与语音采集系统对接,自动分析语音文件包含的语种、声纹、关键词等信息,既可以对实时的语音数据进行预警,亦可以事后对已处理的语音数据进行快速高效的查询,实现说话人、关键词、语种和性别层层过滤的快速语音挖掘。该搜索引擎自投入使用以来,已在实际工作中具体取得很好的效果。有效解决了人工识别效率低和难以实现对海量语音数据的快速有效挖掘的问题,缓解了语音数据激增给业务工作带来的压力挑战。弥补警力不足的现状,实现了科技强警。
其他文献
目的:本研究对2018年1月至2019年12月陈莹教授治疗绝经前后诸证患者的临床医案进行回顾性研究,利用中医传承辅助平台(V2.5)进行数据挖掘,总结导师治疗绝经前后诸证的学术思想
现代社会,职业教育正走在快速发展的道路上,从政府到民间,都越来越重视职业教育地发展。我国人口基数大,人口受教育程度不一,职业教育的目的就是为了让更多地人接受教育,同时职业教育也是我国教育事业的重要组成部分。但职业院校当中的中等职业学校或职业技术中学也就是大家俗称的“中专”往往不被人们看好,这些学校的生源大多都是由初中毕业没有考上普通高中的学生组成,很多家长会选择让子女进入此类学校学一门养活自己的技
目的:观察白虎加桂枝汤联合西药治疗类风湿关节炎(RA)风湿热痹证的临床疗效,为中西医结合治疗RA风湿热痹证提供参考依据。方法:选取2018年5月至2019年7月在广西中医药大学第
当前社会,指纹识别技术已经取得了许多的进展,并已经进入了产品化的阶段,在电子产品,安全,刑侦等领域有着广泛的应用。但在刑侦领域,很多情况下,由于指纹提取环境的复杂性和长时间的环境侵蚀作用,提取指纹的质量很差,甚至无法通过肉眼进行辨认,这对嫌犯的确认工作等造成了很大的困难。对于这类低质量指纹,在指纹的增强复原和比对之前,通常需要通过提取方向场来辅助去噪。本课题面向应用,通过结合深度学习技术和传统图像
在过去三四十年间,众多学者投身中国英语研究,为世界英语、语言态度、跨文化交际等诸多领域的理论发展做出了巨大贡献,其中包括世界英语、语言态度和跨文化交际等。但是迄今为止,有关国际留学生对中国英语,尤其是对中国英语书面语的可理解度和可接受度的研究仍很少见。因此,本文以来自南亚东南亚的国际留学生为研究对象,从文化、经济和政治话语三个类型入手,探究他们对中国英语书面语的理解度和接受度。研究以问卷(172份
《诗话总龟》作为集多家诗话、笔记、小说、史补等文献中的诗作条目于一书的诗话类作品,其前集为北宋阮阅所编,后集多为后人所补。是书前列有《集一百家诗话总目》,悉述其所引书目。本文主要是对前集所引书目中僻书存疑之考证,也即在前人研究基础上,对《总龟》引书的补充考证。将主体部分分为“史部”、“子部”、“集部”三类,通过对僻书存疑之分析,来了解这些书目的作者、思想内容等方面,且以《诗话总龟》对某书的引用情况
新市民社区教育对于新市民群体在精神文明建设,城市社会融入以及最终向市民的身份认同转变方面发挥着重要作用,梅花社区属于苏州典型的新市民社区,梅花社区管理者顺应时代需
目的:直肠癌作为一种消化道常见恶性肿瘤,其发病多与遗传、环境等因素有关,近年来发病率有不断增长的趋势,可引起肠梗阻等一系列并发症,患者的远期生存率与生活质量受到了很
研究背景术后疼痛是手术后发生的急性疼痛,包括躯体痛和内脏痛,主要是由组织损伤时炎症细胞和神经末梢释放一系列的炎症介质(包括组胺、缓激肽、神经生长因子等)所致。术后疼痛
目的本研究旨在对国王帕金森病疼痛量表KPPS(KING’S PD PAIN SCALE)进行跨文化调试,并进行信度和效度检验,为我国帕金森病疼痛评估提供科学依据。方法1.采用文献回顾筛选出