互联网网页蕴含高动态交通信息的实时搜索与语义理解技术研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:shuijing0328
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,人们迫切希望获取一种方法,能够根据自己的需求,高效、快速地从海量的互联网网页内容中搜索出有价值的实时交通信息。然而,大量自然语言描述的交通信息受自然语言理解技术的限制,难以被现在计算机系统直接利用。本文专门针对互联网网页蕴含的动态交通信息,对实时搜索与语义理解的方法进行研究。首先采用网络爬虫技术,实时地从互联网网页(包括微博)上抓取实时交通信息,并根据已构建的词典内容对实时交通信息进行分词,然后把分词结果按已建好的规则库进行匹配,实现语义理解,最后通过实验进行实例验证。本文的主要工作和成果如下:1.研究了互联网网页蕴含动态交通信息的实时搜索方法。针对互联网网页蕴含动态交通信息,从以下几个交通信息来源:官方网站、论坛和微博,分别采用不同的抓取方法进行交通信息的抓取,并保存到数据库中,为后续自然语言理解提供数据基础。2.提出了面向交通信息的自然语言理解方法。针对交通信息的特征和语义理解的应用需求,采用改进的最大匹配分词算法,同时将具有定性、模糊特征的交通信息形式化概括成一个规范的参考模版。并从语义层面将实时交通信息与已有的模版规则进行匹配,从而解决了自然语言形式描述的交通信息难以被现有计算机系统直接理解和利用的问题。3.分别对交通信息实时搜索与语义理解方法进行实现。针对交通信息的不同来源,验证了本研究中所提出方法的正确性和有效性。本文对面向交通信息的搜索与语义理解技术进行了深入的理论研究,并通过实验验证了方法的正确性与效率,解决了自然语言描述的交通信息无法直接被现在计算机理解和利用的问题,具有一定的实际应用价值,为动态导航与位置服务提供重要的数据支撑。
其他文献
随着近年来Internet的爆炸性增长,其安全性问题日益突出。IPSec(IP security)是在IP层实现数据通讯安全的协议,在IP层实现的主要优点有:1)高层的安全技术仅仅保护单个高层协议,而I
Internet的飞速发展使其成为日益重要和最具潜力的资源。WWW作为一种新的信息资源,为计算机领域新技术的产生开辟了新的领域,同时也为传统技术的研究提出了新的方向。 研究
互联网时代的到来,使得高效的搜索引擎成为人们获取信息的最重要手段之一,信息的日益国际化及语言之间的障碍形成了人们对跨语言信息检索的需求,而普遍存在的目标语译词准确性和
分布式数据挖掘的主要目的是为了减少网络通信成本和利用地理上分布的计算资源和存储资源。论文采用网格技术将地理上分布的计算资源合并,并进行分布式数据挖掘,从而实现该目的
单体液压支柱是煤矿地下开采的一种重要的支护设备,单体支柱密封质量的好坏,直接影响到安全生产,因此对单体液压支柱(特别是大修之后)的密封质量检测就显得非常重要。单体液压支
入侵检测系统是一种软件与硬件的结合,它通过分析网络或主机上发生的事件来发现其中的安全隐患。随着近几年网络攻击的事故频频出现,影响范围越来越广泛,入侵检测系统得到越
随着信息技术在电力系统的不断深入与发展,传统的封闭式系统暴露出功能单一、接口专业、结构死板、不易于部署和更新的局限性。而以.NET平台下Smart Client技术的应用显示出
从计算机诞生以来,让计算机或机器人像人类一样具有视觉能力,是科研工作者一直不懈追求的目标。物体检测是人类视觉中的基本步骤和基本功能,为人类了解周围的环境和景物提供了至
在已有的有序决策树归纳算法中,选择条件属性和决策属性的有序互信息值最大的属性作为扩展属性,没有考虑到那些取值多且有序的条件属性和属性之间的相关性,这就造成了重复选
在CBT(Computer Based Training)课件开发平台中,很多的功能和应用都是以多媒体知识库为后台支持的,其中文本语言知识是最基本的知识形式,因此文本知识自动抽取成为CBT课件开