论文部分内容阅读
图表可视化系统是数据分析最有效、简洁的一种方式,然而,基于传统按钮交互方式的可视化系统限制了系统的灵活性、智能性。随着深度学习的不断进步与发展,自然语言处理技术和语音处理技术得到了全面发展。如自然语言生成SQL的相关研究,简称nl2sql,自2017年提出以来发展迅速。将nl2sql技术和语音处理技术应至可视化系统中可有效解决系统灵活性低的问题。因此,本文将nl2sql技术和语音处理技术应用至图表可视化系统中,设计实现了智能语音交互式图表生成系统。系统的实现存在许多挑战和困难,面对不同挑战,首先本文采用动态时间规整算法DTW和无界交错状态回归神经网络UIS-RNN实现了说话人识别算法;其次利用BERT和先验知识对nl2sql模型做了改进提高,并结合应用场景对模型和数据集做了优化;此外系统采用支持向量机SVM、词频逆向文件频率TF-IDF设计实现了图表种类匹配算法模型;最后采用Spring Boot、Mysql等开发技术完成系统的开发。系统划分为5个核心模块,数据管理模块用于管理和维护后端数据;语音控制模块用于用户身份验证和实时的语音识别,依据语音识别的命令,数据检索模块根据命令自动生成SQL语句并完成数据检索;图表可视化模块用于根据语音命令自动匹配可视化图表类型并实现数据可视化;用户管理模块用于用户信息的维护和管理。本文以学术数据的可视化分析为背景,验证了系统的可靠性。系统智能的语音检索方式提高了数据检索的灵活性;丰富的图表种类可以适配不同的分析场景。系统整体上提高了用户数据分析的效率,帮助用户获取数据中的价值。