论文部分内容阅读
作为智慧城市在中国的应用,无线城市项目的提出旨在解决市民生活信息化问题。无线城市的核心是如何将城市中大量的数据进行收集、整合和处理,并将处理之后的数据转化为信息提供给应用使用。与此同时,数据的处理离不开无线城市最终的受众即用户的参与,如何避免信息过载问题的出现,将数据转化为有实际意义和用户感兴趣的信息是无线城市亟待解决的问题。作为无线城市的核心模块,信息库系统运用知识工程和知识库的概念与方法,对无线城市中涉及的海量数据进行统一的模型存储、映射和关联分析。信息库的功能是实现无序数据的规则化,并发掘信息之间的关联性,为最大限度的聚合信息和满足用户的个性化需求而服务。信息库负责实现的是从数据采集、数据抽取、数据分析、数据建模、数据加工到用户推荐这一系列流程。信息库中的核心概念是信息与用户。用户兴趣模型研究的正是如何在用户最少的参与下,分析用户的行为路径,发掘用户的兴趣所在。信息库系统中的用户兴趣模型,是在传统用户兴趣模型基础上,针对无线城市海量数据和不同类别应用而提出的。它的目标是对无线城市中海量无规律的数据进行处理,并分析其中与用户相关的信息,将所有与用户相关联的信息进行加工整理,从而实现用户兴趣的模型化记录和表达。同时,基于用户兴趣模型实现包括推荐系统和搜索引擎在内的服务功能,为用户推荐其感兴趣的结果,验证模型的可行性和效率,从而更好地修正和更新兴趣模型。本文的主要工作可以归纳如下:(1)分析无线城市的实际需求和应用场景,总结归纳无线城市数据特性,提出无线城市信息库的设计思路和实现方案。(2)分析传统用户兴趣模型的优缺点,结合无线城市信息库的特质,提出无线城市信息库用户兴趣模型的处理流程。(3)按照数学建模的思想,结合统计学、数据挖掘、自然语言处理和图论的知识与算法,设计用户信息相关度模型、用户内容相关度模型和用户行为相关度模型,并实现模型融合技术。(4)实现用户兴趣模型的自动化更新,结合搜索引擎和推荐系统的功能,实现基于用户兴趣模型的服务,并解决冷启动问题。(5)讨论无线城市信息库用户兴趣模型的通用性和推广方法,为其它系统采用此用户兴趣模型提出建议。(6)结合推荐系统的测试方法和评测指标,将本系统提出的方法与传统用户兴趣模型的方法进行对比和结果分析,验证效果。