论文部分内容阅读
专利信息中蕴含丰富的知识战略信息,逐渐得到了越来越多的国家、城市以及企业的重视。专利信息的分析能够帮助了解技术的发展趋势、技术发展路线以及技术空白区域等诸多重要信息,有效的缩短技术研发时间和研发费用。因此大量准确的专利信息的获取对于企业的发展越来越重要。目前大部分的专利信息都可以从各国专利数据库中免费获取,但是由于这些专利信息是存在于网络数据库中的,普通的搜索引擎无法检索到,并且专利信息在浏览器中展示,不利于进行各种分析,因此本文提出了基于移动agent和工作流技术的专利信息获取系统。
本文研究了从美国专利数据库以及欧洲专利数据库中获取专利信息的全部过程,包括专利检索、接口分析、专利下载以及专利抽取,并将移动agent技术、工作流技术等应用在专利获取过程中,以便于准确的从美国专利数据库和欧洲专利数据库中获取所需的专利信息。
本文使用移动agent技术和工作流技术的方法设计了专利信息采集系统,系统包含用户接口子系统、中心控制子系统、爬行子系统和抽取子系统。各个agent相互协作执行,共同完成专利采集任务。本文主要论述了移动agent的结构及其调度方法,以及各个子系统的工作流。本文使用JAVA语言,在JADE和WADE平台上实现了专利采集系统,经过多次实验,原型系统能够准确的获取所需的专利信息。
本文的创新之处在于;第一,综合运用移动agent技术和工作流技术,以及相关的工具和插件,实现了从美国专利数据库和欧洲专利数据库中采集专利信息。第二,研究了专利信息采集的关键技术,包括欧洲专利数据库的接口分析、专利信息页面获取方法、专利抽取方法和规则,以及爬行移动agent的移动策略算法,并考虑到了系统的安全性问题。第三,实现了专利信息采集的原型系统,实现了根据检索式从美国、欧洲专利数据库中采集专利信息的全过程。