论文部分内容阅读
专利发明人分析为技术人才评价和科研团队识别提供有力的数据支撑。然而,中文姓名存在大量重名现象,使得基于发明人的研究结果出现偏差。本文提出一种基于规则的中文专利发明人重名消解方法。针对专利申请人因为并购、拆分、重组或战略转型等原因造成的名称不一致情况,采用基于向量空间模型的余弦相似度算法进行识别;针对因门牌号书写不规范而造成的地址不一致情况,采用基于邮编和门牌地址的分级匹配算法进行识别;合作者相似度采用Jaccard系数计算。以中国科学技术信息研究所《电动汽车专题数据库》为例,验证该方法的科学性和有效性。