论文部分内容阅读
随着云制造服务模式的提出,创建出一种装备制造业信息化发展的全新商业服务模式。这是互联网的技术与制造技术相结合的网络信息化,应用于产品生命周期服务。这种模式将制造资源虚拟化、协同化、智能化的异地充分共享,为制造业的服务提供商和用户提供专业的服务。云制造平台搭建的研究目前还在起飞阶段,在资源感知,物联及接入适配技术上有所探索,但在海量的信息采集技术方面的研究略显匮乏。现阶段的信息采集模式多为大范围的搜索,信息采集基于最大化抓取数据的原则,只注重采集到的数量和范围,而忽略了采集到的主题内容相关性和顺序权重。这样往往因采集的页面数量过多而消耗了硬件资源和网络带宽,造成采集的效率低和用户体验差。因此不很适合于云制造创新服务平台中的信息采集。本文以云制造创新服务平台为依托,结合云制造平台的特点来设计一种新的采集方法,并进行研究分析与实践应用,使云制造创新服务平台能在采集海量信息的同时保证信息与制造业信息的相关性,提高资源的利用率,为用户提供更有针对性、灵活多变的专业性服务。具体工作如下:(1)分析现有的信息采集方法,结合云制造平台所需要采集的海量、多态、无序、多重的互联网信息的特征,据此设计一个相对完善高效的信息采集方法。(2)综合比较已有搜索引擎所使用的技术和编写规则,对页面采集、页面分析、信息提取、内容提取、链接解析、内容过滤各个步骤进行详细的规则设定和编写。将会更适应于制造业资源的采集工作。(3)学习计算机网络平台编程语言及数据库理论,确定合适的网络平台构架及数据库结构;在搭建好的云制造创新服务平台中实现信息采集模块的运作并与数据库的连接。经过运行测试表明,本文所构建的信息采集方法满足对海量装备制造业信息采集的要求;信息采集系统建立在制造信息的收集是可以实现的;作为云制造平台的一部分,信息采集模块可以实现其访问数据库的操作。