【摘 要】
:
互联网技术的飞速发展加快了计算机软件产业变革的进程,开源运动在世界范围内如火如荼的进行着。从开发者,到业界相关组织乃至全球知名的IT巨头,纷纷加入到这场开源运动中来,
论文部分内容阅读
互联网技术的飞速发展加快了计算机软件产业变革的进程,开源运动在世界范围内如火如荼的进行着。从开发者,到业界相关组织乃至全球知名的IT巨头,纷纷加入到这场开源运动中来,成为开源软件的忠实拥趸。开源意味着软件开发过程从封闭走向开放,软件产品的所有权由独占变为共享。而开源软件的诞生和成长都是在开源社区中进行的,群体的智慧在开源社区中交融,知识的光辉在开源社区中闪耀。开源软件数量指数级的剧增推动了开源社区的迅猛发展。最终开源社区分化为了以群体化开发为导向的协同开发社区和以思维交流碰撞为导向的知识分享社区这两种形态。这两类开源社区包含了海量的开源数据资源,它们相互关联,紧密交织,共同构成了一个有机的开源生态系统。开源社区的异构性以及海量开源数据资源存在的分散性为面向开源社区的Web数据抽取技术的研究带来了巨大的挑战。通过对开源社区数据的特点和信息抽取相关技术的深入分析研究,本文提出了一种基于数据分块的Web数据抽取规则生成算法,自动生成基于Xpath和正则表达式的抽取规则模板,能够实现对Web数据的有效抽取。构建了一个支持Web页面预处理、数据抽取与持久化等的通用的Web数据抽取框架。实现了一个面向开源社区的Web数据抽取原型系统,并集成到OSSEAN开源软件检索与分析平台,最后对面向开源社区的Web数据抽取系统的有效性进行了验证。面向开源社区的Web数据抽取系统实现了对开源社区中的Web数据的有效抽取,为基于开源社区深度数据挖掘的开源大数据服务平台“OSSEAN”的开发和运行提供了强有力的数据支撑。
其他文献
面部识别技术最初是以人脸为研究对象而迅速发展,随着其研究的不断深入及应用领域的不断拓展,人们将其逐渐应用于各种动物的面部识别上,比如黑猩猩、金丝猴等。基于面部图像
随着电子技术的飞速发展,嵌入式系统的应用已经深入到人们生活的方方面面。传统的嵌入式技术已不能满足人们对嵌入式产品性能日益增长的需求。将虚拟化技术引入嵌入式领域,使
属地管理作为当前我国信访工作的一项法定原则,旨在将信访矛盾处理于源头,化解于基层。基于任务与权能失配、事权与财权分离、责任属地而权力不属地,趋利和避害对人的心理驱
当前“一带一路”基础设施建设规模日益扩大,中企积极响应“一带一路”倡议,规划国际发展路线,开始在海外大力投建基础设施。为了衡量国际战略规划实施有效性,一套科学的海外基础设施项目投资绩效评价方法成为必备工具。如何客观、科学地对基础设施项目投资绩效进行综合评价,还没有统一、权威的标准。因此,对海外基础设施项目构造科学、合理的投资绩效评价体系成为迫切需要解决的问题。论文以“一带一路”中非合作代表性项目—
湿地作为重要的自然资源和国土资源,其独具的资源潜力和环境调节功能,对人类生存环境、资源利用和社会经济的可持续发展具有重要意义。近年来,受城镇基础设施建设、群众生产生活等因素影响,湿地资源在分布面积、生态状况、威胁因素等方面发生了重大变化,但相关调查还有所欠缺。湿地植物是发挥湿地生态服务功能的基础和前提,维持湿地生态平衡的重要组成部分,而湿地植物资源是湿地重要的资源之一。本文通过对宁波市北仑区的湿地
近年来,喇叭天线越来越多的被应用于卫星通信领域,其原因是其具有很高的通信稳定性、较低的插入损耗和能承载较大的功率容量。传统的波纹喇叭结构上比较单一,口面场具有比较
随着移动终端的日益普及和物联网规模的迅猛扩张,移动流量呈爆炸式增长,对新型网络架构的设计带来巨大挑战。本文针对第5代移动通信技术(5G)中小基站组网模式,结合移动轨迹的
采用轻质合金材料是材料轻量化的重要途径,在交通运输和航空航天等领域能够达到节约能源的目的。然而,使用传统加工工艺无法实现轻质合金材料的成形加工,表现为室温下成形性能低,拉延性差,易撕裂和回弹等现象。为此,电磁成形技术以成形高应变率、无接触和单磨具等优势得到重视,成为轻质合金材料加工的重要手段。目前,电磁成形技术普遍用于板件材料和管件材料的成形加工,分为电磁板件成形技术和电磁管件成形技术;其中,电磁
城市地下排水管道是重要的城市基础设施,对其日常的检测与修复能够确保排水系统正常运作及延长管道使用寿命。现今广泛使用CCTV管道闭路电视检测系统对管道进行检测,但该系统在管道图像的采集与缺陷判读过程中都需人工参与,尤其是对管道缺陷的判读,工作人员对缺陷判断结果的主观影响较大,包括工作人员的工作经验及工作状态都将影响判断结果。为弥补管道判读过程中过分依赖工作人员的问题,本文重点针对地下排水管道缺陷的特
目的:观察阿是超声波治疗仪治疗局部软组织疼痛的临床疗效,并与超激光疼痛治疗仪比较,为临床应用提供参考。方法:40例有明显局部压痛点的软组织疼痛患者分为两组,每组20例。