论文部分内容阅读
利用网络爬虫与自然语言处理技术,通过获取网络数据开展对产业集群的研究。在特定产业集群区域采用定向网络爬虫抓取企业网页信息并进行解析,获取包括公司名称、供应产品、注册时间和地址等结构化数据;通过对文本信息的处理,利用聚类算法分析进行网络层次聚类,同时结合了地理空间数据,利用自下而上的网络分析方法映射到集群实体空间,对产业集群展开空间特性研究。基于聚类结果辨识出宁波地区注塑机集群7种具有不同产品结构的主体,结合核密度估计法与空间关联分析法,从时序与空间的角度讨论注塑机集群特性以及集群内部成员之间的关联性,为基