智能语音会议纪要系统的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:hankeycncn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的发展,越来越多的研究者和开发者使用机器学习和深度学习的算法开发出更加智能化的应用。人工智能领域包括机器人、语音识别、图像识别、自然语言处理和专家系统。在日常生活中,语音识别和自然语言处理应用最为广泛,但是这些算法在使用上比较单一,没有将两种或多种组合算法和技术应用到同一个场景中。技术是自然语言处理中应用最为广泛的技术之一,该技术在不改变大篇幅文档原意的情况下,自动的总结生成主要内容。在这个海量的信息时代,这项用简短的文本表达信息主要内容的技术,有利于缓解信息过载问题。机器情感分析是人们对问题、事件或话题的观点、情绪和态度的计算研究。情感分析技术使得机器通过语音和文字来感知情感,在特定场景下,利用语音和文字的情感,发掘潜在的用户信息和商业信息。本文基于深度学习中语音识别技术、文本摘要抽取技术和情感分析技术实现了智能语音会议纪要系统。首先,系统语音处理模块由说话人分类模块和语音识别模块组成。语音处理模块用于将会议语音转化为会议剧本。说话人分类模块利用说话人多音频流时间轴策略对会议语音中的说话人进行分类和标记,主要研究和实现了语音端点检测技术。语音识别模块主要研究语音识别现有的优秀算法,尤其是带有注意力机制的语音识别算法,并对比常用语音识别模型的精度和响应时间。其次,系统文本处理模块是由文本摘要模块和情感分析模块组成。文本处理模块将语音处理模块输出的会议剧本作为输入,提取总结会议摘要并对会议总结进行情感分析,分析会后参会人员实施的可能性。文本摘要模块介绍了文本词向量化技术,研究了摘要提取和生成的技术,其中包括:抽取式摘要技术和生成式摘要技术,同时实现了基于ELMo词向量技术和注意力机制的摘要抽取模型的文本摘要模型。情感分析模块研究了音频情感特征提取方法,情感分析双向LSTM模型,并利用TensorFlow深度学习框架搭建了语音情感分析模型。最后,系统使用Python中搭建Web服务的引擎技术,将上述模块分别用引擎的方式实现,组合成会议纪要系统。针对不同的功能模块分别做了相应的工程测试,并利用系统测试工具对系统的性能进行测试分析,验证系统,满足需求。
其他文献
新媒体时代为视觉传播教育提供了更多的机会。在这种背景下,视觉传达教育通过自身的改革和提升,可以为国家和社会引进更多的创新型人才。只有把视觉传达设计教育与企业结合起
随着科技的快速进步,语音识别技术的性能越来越好,其应用场景越来越广泛。然而,语音识别所在环境极为复杂,使得鲁棒性语音识别的研究的意义越来越重要。近年来,深度神经网络理论的快速发展使得这一方法的应用场景不断增加,已经广泛应用到了计算机视觉、自然语言处理等多个方向。本文使用深度神经网络的方法,针对语音前端处理的两个问题进行探讨:语音分离与波束生成。(1)针对语音分离问题,我们采取基于深度神经网络的掩蔽
采用两种制备方法(M1、M2),分别对三种活性炭(AC1、AC2、AC3)进行负载纳米氧化铁实验研究.通过不同材料对Cu(Ⅱ)吸附量的筛选实验,得出AC2-M2对Cu(Ⅱ)吸附量最大.对AC2-M2进行的静态吸附
习近平总书记在党的十九大报告中指出,加快生态文明体制改革,建设美丽中国.海绵城市作为生态文明建设的一项重要内容,对于修复城市水生态、涵养水资源、增强城市防涝能力具有
采用TIG增材制造的方法成型TC4钛合金零件,并对成型件的力学性能特征及焊接工艺参数对成型零件的力学性能的影响规律进行研究。研究发现,所成型零件的力学性能存在着各向异性,这
单元检测作为一项重要的教学活动,一方面可以考查教师对某一单元所教内容的重难点把握情况,另一方面可以检查学生对该单元知识的掌握情况。所以,教师经常设计、编制较高质量的试
分析了交流励磁变速恒频双馈风力发电系统的基本原理,从双馈发电机的数学模型出发,采用矢量控制技术,在电磁暂态分析软件EMTP-ATP上建立了双馈风力发电系统模型,包括风轮机模
政府审计的预警职能在维护国家经济安全方面发挥着至关重要的作用。目前,大多数文献资料对政府审计预警职能的研究集中在预警指标体系的构建上,而对政府审计预警机制的整个运
结合植物保护专业《农业昆虫学》课程的特点,分析了当前在课堂讲授、课程实验和实地实习教学中存在的主要问题,并从教材内容的调整与补充、教学资源的保证及教学方法的改革等
我国社会组织的类型和性质复杂,而法律保障不足又使得社会组织难以成为社会治理的主体,难以真正发挥作用。解决社会组织的发展问题,首要解决的是社会组织的法律地位问题。通