【摘 要】
:
伴随着信息技术的发展,卫星跟踪技术使得长时间连续跟踪野生鸟类成为可能.同时,鸟类长距离迁徙过程中的强关联的栖息地,在生物学行为研究,动植物栖息地保护,以及鸟类禽流感(H5N1)传播路线的研究上有着重要的科学意义.为了发现鸟类迁徙的强关联栖息地,本文将传统生物学的问题转化为一个图挖掘过程.相对于鸟类在大范围时间尺度迁徙是线性的序列飞行路线,鸟类的迁徙活动在某一个时间段或者某个区域是以结构化图的形式存
【机 构】
:
中国科学院计算机网络信息中心,北京 100080;中国科学院研究生院,北京 100039 中国科学
【出 处】
:
第十届科学数据库与信息技术学术研讨会
论文部分内容阅读
伴随着信息技术的发展,卫星跟踪技术使得长时间连续跟踪野生鸟类成为可能.同时,鸟类长距离迁徙过程中的强关联的栖息地,在生物学行为研究,动植物栖息地保护,以及鸟类禽流感(H5N1)传播路线的研究上有着重要的科学意义.为了发现鸟类迁徙的强关联栖息地,本文将传统生物学的问题转化为一个图挖掘过程.相对于鸟类在大范围时间尺度迁徙是线性的序列飞行路线,鸟类的迁徙活动在某一个时间段或者某个区域是以结构化图的形式存在.传统的图挖掘算法没能考虑图数据的顶点和边的权重,但是鸟类迁徙的图结构化数据是带权重子图.针对这一类型的权重图数据,提出带权重的联通子图挖掘算法(HELEN),并将算法成功应用到了青海湖鸟类的卫星跟踪迁徙数据中.并通过图挖掘结果与H5N1爆发地点的空间关联性分析,发现鸟类在迁徙过程中与禽流感爆发存在着时间和空间关联性.
其他文献
数据的特征选择是当前信息领域的研究热点之一.本文从不同的分类角度分析了特征选择算法的特性并列举了对应的较为重要且具有代表性的算法.最后从提高大规模数据特征选择算法稳定性的角度,借鉴数据集成的思想,提出了基于Boosting的特征权重组合算法的设计.
通过对现有的大量空间环境探测数据的深入分析,根据空间环境探测数据种类繁多、原始数据文件格式各异、数据处理和计算方法复杂,数据量大等特点,本文以空间环境探测数据为主线,提出一个基于科学工作流方法而构建的大规模空间环境探测数据处理过程模型,以解决传统数据处理模式存在的一些弊端.此模型为大规模空间环境探测数据的集中有效处理提供解决方案,具有一定灵活性和可扩展性.
本文通过分析科学数据库当前数据的特点,结合当前数据网格环境的建设,提出了对当前数据进行细粒度分解的处理方案,通过将细粒度的数据发布为Web Service,并建立统一索引表的方式,为细粒度数据提供了的统一的访问接口.最后通过对人地系统主题数据库中与水资源相关的数据集的细粒度分解和开发应用,表明对数据的细粒度分解处理是对数据网格环境建设和数据无缝获取的有效途径,人地系统主题数据库将在后面的工作中大力
当前,科学研究已经产生了大量的研究数据,但是这些数据类型丰富、分布分散、格式复杂,使得研究人员将更多的精力投入到数据收集和处理而非科学问题的研究上.本文提出了一个数据管理与共享应用平台来解决这个问题.介绍了冰雪冻土环境本底与可持续发展专题数据库的技术设计和关键实现,建立了完善的基于数据分类、数据编码、元数据等技术的数据库管理与应用支持系统,实现了关键数据产品的制备和基于数据的应用支持.提出了数据分
在过去的20多年里,科学数据库积累了大量的数据资源.如何完成对这些数据的搜索与访问,成为科学数据共享与集成过程中的一个重要问题.由于科学数据的特点,传统的搜索引擎如Google、百度搜索对其并不具有很好的适用性.本文结合科学数据的特点及其共享现状,提出了一种轻型的、非侵入式的科学数据搜索引擎voovle,并对其中的科学数据统一的命名、统一的模型描述、统一的格式表达、统一的获取访问与统一的数据展现五
WebGIS是Internet技术应用于GIS开发的产物.GIS通过Web功能得以扩展,通过Web发布地图、浏览空间数据和制作专题图等.目前流行的基于B/S模式的WebGIS开发工具主要有ArclMS、ArcGIS Server以及基于RIA(富互联网应用)技术的Adobe Flex.基于B/S架构,分别利用ArclMS、ArcGIS Serv和Flex三种典型的开发工具构建珠三角POPs(持久性
经济指标类数据管理共享平台的建设不仅为“平台”建设提供统一的数据访问和集成接口,支持了“平台”各个示范系统的建设,也为基于关系数据库的离散值数据的集成共享提供了借鉴和相关的建设经验。目前,数据管理共享平台的建设工作已经完成,今后一段时间将着重于数据服务方面的设计和开发任务,为各个示范系统建设单位提供统一的基于服务的数据访问中间件。
XML的一个显著优点是能够以一致的方式表示从无结构到高度结构化的各种数据.针对XML文档集合的查询和检索要求能够对各种不同数据的结构和内容进行选择和搜索.本文提出XML文档集合的一种查询检索模式,通过结构化关键词查询语言,将XML文档结构的选择和文本内容的搜索结合起来;该模式在XML文档集合上实现结构化查询和关键词查询的无缝集成,提出了集成结构索引和倒排索引的索引策略,通过执行结构化关键词查询处理
本研究给出了地学数据资源加工增值的一般概念和方法。这一研究对于充分利用和挖掘中国科学院科学数据库中的海量数据资源具有重要意义。从应用角度而言,目前的这一技术方法还只是初步研究,仍然需要结合地学领域数据的复杂特点,探索更多的数据加工实例,进而归纳和研究更普遍意义的核心模型和技术模式。
本文以青海湖斑头雁(Anser Indicus)为研究对象,利用2008年卫星跟踪实时数据,分析了斑头雁在中国境内秋季迁徙路线、迁徙沿线的生境.表明青海湖斑头雁有四条典型的迁徙路线,迁徙方向大体一致;斑头雁个体的迁徙日期、到达越冬地的日期不同,中途停留3~6次,迁徙直线距离为1 300~1 500 km,迁徙全程一般需要73~83天;停留地的生境类型大多为湖泊、沼泽和滩涂湿地,也有山地和农田;停留