论文部分内容阅读
随着我国经济快速增长和人民生活水平显著提升,居民对身体健康和生活品质提出了更高的要求,尤其是生活中赖以生存的饮用水水质问题,同时随着社会发展与科技变革,水质中的污染有害物种类也在不断增加,供水水质安全问题已成为社会安全的热点问题。而居民对自来水水质的疑问和投诉是对供水水质最直接的判断,是对企业供水工作最直接的监督,同时通过对水质投诉数据的分析与标记,有利于及时发现水质变化以及辅助发现水质变化规律。基于居民的投诉需求和水务部门的管理需求,某市已经成立供水服务热线,二十年来处理了上百万件供水投诉问题,有限的工作人员和众多的投诉需求,既对合理答复并处理的效率提出了更高的要求,也促使投诉方式与形式更加多元化、信息化,为居民投诉提供便利;同时,投诉的问题多而复杂,这些投诉数据本身又是一种具有研究价值的数据,通过对这些投诉数据进行深入的分析,可以实现高效的水务管理、发现水质变化的规律,使居民的投诉热线“冷”下来,城市供水水平与质量得到大幅度提升。本文基于实际需求,建立了一个基于自动分词处理的城市供水投诉管理平台,实现了对大量电话录音转制的投诉文本数据的自动分词、分析和可视化的展示。在本文工作中,系统地解决了从不同数据源数据的导入、管理、分词处理、数据分析与可视化的一站式服务流程。本文的主要工作包括以下几个方面:首先,针对城市供水投诉的数据来源不同,建立了基于HDFS的统一数据导入接口,可以支持页面输入数据、本地文件数据、服务器数据等多种来源的数据导入。第二,通过集成分词工具,实现了对大量历史投诉文本数据的分词处理,建立了增量式供水与投诉词典库,并为管理者提供了词典管理接口,方便后续对投诉词典的维护。当用户的投诉数据导入进来时,系统会自动根据投诉词典为用户的投诉内容进行匹配,同时用户可以对投诉结果进行满意度评价。第三,设计并实现了通过Java调用R服务的技术路线,在系统中实现了投诉数据的分析,并提供多种形式的可视化展示方式,针对不同的数据类型与分析结果,为用户提供具有交互性的数据可视化图表,同时扩展了多级图表、表级联动等展示选择。第四,搭建了基于Web服务的城市供水投诉分析管理平台。系统采用MVC架构,数据存储层采用基于HDFS的分布式文件存储系统,易于未来与水质大数据分析系统集成;实现了用户投诉、投诉管理、文件管理、词典管理、数据处理工具、可视化展示、投诉处理管理等主要模块。最后,本文实现的平台为水务管理部门提供了界面友好、具有交互性的城市供水投诉管理系统,既满足了用水用户的投诉需求,大大提升了对供水投诉数据处理的效率,又便利了水务管理部门对投诉数据的管理,通过利用平台中的工具对投诉数据进行更深入的认识,做出更好的决策,提供更加便利、高质量的供水服务。