论文部分内容阅读
内容提要
专利引证信息是非常重要的专利技术信息,其可以用于评价专利的价值,还可以用于判断专利技术的技术渗透转移情况和专利技术聚集特性。通过运用统计分析的方法,可以从不同视角对专利引证信息加以利用,从而更好的挖掘专利信息,为相关决策提供支持。最后,讨论了我国在专利引证信息公开及其研究时应当注意的问题。
刘斌强
国家知识产权局助理研究员
江玉得
北京天智博远咨询有限公司咨询顾问
众所周知,专利文献信息是非常重要的技术、法律文件信息,其中,专利引证信息是专利文献信息中反映技术信息的非常重要的一个方面,对专利引证信息的多方位利用,可以更好的挖掘专利信息,为相关决策提供支持。以下将从专利引证信息定义、专利引证信息记载形式及专利引证信息应用三个主要方面进行阐述。
一 、专利引证信息定义
专利引证信息的定义可以分为狭义和广义两大类,狭义的专利引证,指的是对于被分析专利文献P*,其所引用的相关引文信息,包括引用的专利信息和非专利信息(如期刊论文、会议文章、技术标准等)。通常,这类信息又称为后向引用信息(BC,Backward Citation),因为其相对于专利文献P*处于更早的时间(Backward Time)。
但是,如果仅限于后向引用信息,显然不能够全方面的反映被分析专利的特性,比如其技术价值,因为,被分析专利P*被后续文献引用的信息,显然也是反映被分析专利的特性的因素,因而,广义的专利引证信息除了包括后向引用信息外,还引入了前向引用信息(FC,Forward Citation),其引用了被分析专利文献P*且相对于专利文献P*处于更后的时间(Forward Time)。本文中的专利引证信息,将采用广义概念。
二、专利引证信息记载形式
对于被分析专利文献P*而言,其引证信息的表现形式,较佳的是遵照有关标准在专利文件的著录项目中予以记载,更佳的,可以根据引证信息的类别,比如本国/外国专利文献、非专利文献、申请人引用文献、审查员引用文献等,进行分类记载。
此外,除了在专利文件上予以记载外,为便于在机检数据库中进行检索,在构建专利数据库时,应当对引证信息进行相应的标引,从而为检索人员提供灵活的检索入口,并便于做进一步的分析。
三、专利引证信息应用
如前所述,专利引证信息是非常重要的专利技术信息,基于不同的使用目的,专利引证信息的应用场合也是多样的。以下从专利价值判断、专利技术渗透转移和专利技术聚集特性三个方面探讨专利引证信息的应用。
(一)专利价值判断
很多情况下,需要对被分析专利文献P*的价值进行判断,此时,运用专利引证信息,就可以提供很好的专利价值判断依据。具体判断时,可以依照下面的方法:
1、利用后向引用信息
对于被分析专利P*,首先可以统计其后向引用信息,即被分析专利P*引用了的引用信息。这些信息可以通过专利文献著录项目的记载获得,也可以通过机检数据库利用CT、EX、OC、OP、RFAP、RF等字段信息进行检索和统计。
在检索结果中,首先,后向引用信息会涉及引用数量BCnum问题,即被分析专利P*引用的引文信息数量。一般而言,BCnum越大,被分析专利P*的价值或重要性越高;其次,后向引用信息还会涉及时间差的问题,具体即为每个后向引用与被分析专利P*的时间差TDBC,一般地,TDBC越小,则被分析专利的价值或重要性越高。
2、利用前向引用信息
对于被分析专利P*,还应当统计其前向引用信息,即引用了被分析专利P*的引用信息。一般而言,由于前向引用是在专利文献公开之后发生的,因此,前向引用信息无法在专利文献公开的时候预知、从而也无法在专利文献的著录项目中予以记载,但是,由于机检数据库记录的可读写特性,前向引用信息可以通过数据标引的形式,在机检数据库中予以标引,从而可以供检索与统计分析。
与后向引用信息类似,前向引用信息同样会涉及引用数量FCnum问题,即引用了被分析专利P*的引文信息数量。一般地,FCnum越大,说明被分析专利P*被后续文献引证的频率越高,被分析专利P*的重要性或价值也相对越高;其次,前向引用信息同样也会涉及时间差的问题,具体即为每个前向引用与被分析专利P*的时间差TDFC,一般而言TDFC越大,则说明被分析专利的技术影响力更大,被分析专利的重要性或价值也相对越高。
3、引用信息的双向延伸
前面1和2中,仅仅是以被分析专利P*为基点,分别往前(过去时间)、往后(将来时间)一级进行分析。实际上,不论是后向引用,还是前向引用,每个引用信息本身的重要性,即引用信息对被分析专利P*的价值的贡献度,显然并不总是一样或相同的,因此,就涉及到对引用信息的重要性的判断,并将引用信息的重要性作为一个参数,在判断被分析专利P*的重要性/价值时予以考虑。
由于引用信息既可能是专利文献,也可能是非专利文献,鉴于专利文献与非专利文献的不同性质,其本身的重要性判断方法是不同的,限于篇幅,本文下面将仅针对专利文献类型的引用信息继续讨论。
在假定引用信息是专利文献的情况下,由于同样是专利,因而,其重要性/价值的判断,可以适用前面对被分析专利P*的价值或重要性判断方法,即:需要对(专利文献类型)引用信息的前向引用、后向引用情况进行统计和分析,进而获得当前被分析专利P*的引用信息的重要性。
这个时候,就会出现一个问题,由于引用信息可能是无限延伸的,即:当前被分析专利P*的后向引用BC可能也会有后向引用信息Pbc*和/或前向引用信息Pfc*,该后向引用信息Pbc*和/或前向引用信息Pfc*可能还会有后向引用信息P’bc*和/或前向引用信息P’fc*,如此持续追溯,以及,当前被分析专利P*的前向引用信息FC可能也会有前向引用信息Pfc*和/或后向引用信息Pbc*,该前向引用信息Pfc*和/或后向引用信息Pbc*可能还会有前向引用信息P’fc*和/或后向引用信息P’bc*,如此持续追溯。
限于时间和精力的限制,显然不可能做无止境的追溯,并且,应当可以理解的是,一般而言,离当前被分析专利P*的层级越远的引用信息,其对当前被分析专利P*的重要性的贡献度越小,是呈递减趋势的。
因此,为了能够充分考虑到引用信息对当前被分析专利P*的重要性的贡献度问题,建议分别从后向引用、前向引用再向后、向前双向延伸特定级数的层级,通过这种特定级数下的双向延伸,给每个与当前被分析专利P*有关的后向引用、前向引用赋予一定的权重,避免纯粹的“以引用数量取胜”,使被分析专利P*的重要性评价更趋合理。
(二)专利技术渗透转移
除了用于进行专利技术价值判断,专利引证信息还是用来判断不同国家、地区之间的技术渗透、技术转移情况的重要手段,下面同样仅针对专利文献类型的引用信息展开讨论。
对于被分析专利P*,对其后向引用信息的主要国别信息进行统计分析,可以判断该专利技术主要源自哪个国家或地理区域,这也从一定程度上反映出被分析专利P*在地理区域上的技术依赖性。
反过来,当被分析专利P*作为被引证信息时,其反映出来的,是被分析专利P*的技术在地理区域上的影响力、其技术渗透能力。可以想像,如果被分析专利P*被不同地理区域的专利文献用作引证信息,那么被分析专利P*则在该地理区域造成了技术影响,其技术渗透到该区域。显然,如果被分析专利P*的被引用覆盖地理范围越广,则其技术渗透能力、技术影响力相对越高。
最后,专利技术的渗透还体现在技术领域的渗透上,对于被分析专利P*,通过对其引证信息的分析,尤其是对其前向引用信息的聚类分析,可以统计出专利技术是否渗透到其它的技术领域,以及在所渗入技术领域的影响。
(三)专利技术聚集特性
此外,从更微观些的层面,还可以运用专利引证信息来判断专利的技术聚集特性,包括创新主体/申请人聚集特性、发明人聚集特性等,简述如下。
通过对被分析专利P*引证信息的分析,可以通过聚类的方式,统计挖掘引证文献的申请人信息、发明人信息。根据聚类结果,可以得出哪些申请人在专利技术所在的技术领域是活跃的、占主导地位的,并进而发现专利技术的聚集特性,比如是否仅集中在少数的几个企业、研究机构等。
此外,通过对引证文献中的发明人信息的聚类分析,还可以得出在专利技术领域中,主要的发明人都是哪些,据此可以做出进一步的相关决策。
四、结语与建议
专利引证信息是非常重要的技术信息,其不仅可以用于评价专利的价值/重要性,还可以用于判断专利技术的技术渗透、技术影响情况。不过需要注意的是,对于专利引证信息的利用,应当采用统计分析的方法,因为单个专利的引证信息往往难具代表性。通过运用数学方法,建立适当的统计模型,可以从不同的视角对专利引证信息进行统计分析与研究。
目前,国内关于专利引证信息的研究,尤其是实证研究尚不多见,有待加强这方面的努力。另外,虽然我国目前尚没有在公开/公告的专利文献著录项目中记载专利引证信息,但是,随着时间的推移和我国技术的进步,迈出这一步只是早晚的事情。值得注意的是,倘若将来决定公开专利引证信息,建议预先进行较细的分类并予以明确记载,同时在机检数据库中也应当予以标引,为日后对专利引证信息的最大程度利用奠定基础。
专利引证信息是非常重要的专利技术信息,其可以用于评价专利的价值,还可以用于判断专利技术的技术渗透转移情况和专利技术聚集特性。通过运用统计分析的方法,可以从不同视角对专利引证信息加以利用,从而更好的挖掘专利信息,为相关决策提供支持。最后,讨论了我国在专利引证信息公开及其研究时应当注意的问题。
刘斌强
国家知识产权局助理研究员
江玉得
北京天智博远咨询有限公司咨询顾问
众所周知,专利文献信息是非常重要的技术、法律文件信息,其中,专利引证信息是专利文献信息中反映技术信息的非常重要的一个方面,对专利引证信息的多方位利用,可以更好的挖掘专利信息,为相关决策提供支持。以下将从专利引证信息定义、专利引证信息记载形式及专利引证信息应用三个主要方面进行阐述。
一 、专利引证信息定义
专利引证信息的定义可以分为狭义和广义两大类,狭义的专利引证,指的是对于被分析专利文献P*,其所引用的相关引文信息,包括引用的专利信息和非专利信息(如期刊论文、会议文章、技术标准等)。通常,这类信息又称为后向引用信息(BC,Backward Citation),因为其相对于专利文献P*处于更早的时间(Backward Time)。
但是,如果仅限于后向引用信息,显然不能够全方面的反映被分析专利的特性,比如其技术价值,因为,被分析专利P*被后续文献引用的信息,显然也是反映被分析专利的特性的因素,因而,广义的专利引证信息除了包括后向引用信息外,还引入了前向引用信息(FC,Forward Citation),其引用了被分析专利文献P*且相对于专利文献P*处于更后的时间(Forward Time)。本文中的专利引证信息,将采用广义概念。
二、专利引证信息记载形式
对于被分析专利文献P*而言,其引证信息的表现形式,较佳的是遵照有关标准在专利文件的著录项目中予以记载,更佳的,可以根据引证信息的类别,比如本国/外国专利文献、非专利文献、申请人引用文献、审查员引用文献等,进行分类记载。
此外,除了在专利文件上予以记载外,为便于在机检数据库中进行检索,在构建专利数据库时,应当对引证信息进行相应的标引,从而为检索人员提供灵活的检索入口,并便于做进一步的分析。
三、专利引证信息应用
如前所述,专利引证信息是非常重要的专利技术信息,基于不同的使用目的,专利引证信息的应用场合也是多样的。以下从专利价值判断、专利技术渗透转移和专利技术聚集特性三个方面探讨专利引证信息的应用。
(一)专利价值判断
很多情况下,需要对被分析专利文献P*的价值进行判断,此时,运用专利引证信息,就可以提供很好的专利价值判断依据。具体判断时,可以依照下面的方法:
1、利用后向引用信息
对于被分析专利P*,首先可以统计其后向引用信息,即被分析专利P*引用了的引用信息。这些信息可以通过专利文献著录项目的记载获得,也可以通过机检数据库利用CT、EX、OC、OP、RFAP、RF等字段信息进行检索和统计。
在检索结果中,首先,后向引用信息会涉及引用数量BCnum问题,即被分析专利P*引用的引文信息数量。一般而言,BCnum越大,被分析专利P*的价值或重要性越高;其次,后向引用信息还会涉及时间差的问题,具体即为每个后向引用与被分析专利P*的时间差TDBC,一般地,TDBC越小,则被分析专利的价值或重要性越高。
2、利用前向引用信息
对于被分析专利P*,还应当统计其前向引用信息,即引用了被分析专利P*的引用信息。一般而言,由于前向引用是在专利文献公开之后发生的,因此,前向引用信息无法在专利文献公开的时候预知、从而也无法在专利文献的著录项目中予以记载,但是,由于机检数据库记录的可读写特性,前向引用信息可以通过数据标引的形式,在机检数据库中予以标引,从而可以供检索与统计分析。
与后向引用信息类似,前向引用信息同样会涉及引用数量FCnum问题,即引用了被分析专利P*的引文信息数量。一般地,FCnum越大,说明被分析专利P*被后续文献引证的频率越高,被分析专利P*的重要性或价值也相对越高;其次,前向引用信息同样也会涉及时间差的问题,具体即为每个前向引用与被分析专利P*的时间差TDFC,一般而言TDFC越大,则说明被分析专利的技术影响力更大,被分析专利的重要性或价值也相对越高。
3、引用信息的双向延伸
前面1和2中,仅仅是以被分析专利P*为基点,分别往前(过去时间)、往后(将来时间)一级进行分析。实际上,不论是后向引用,还是前向引用,每个引用信息本身的重要性,即引用信息对被分析专利P*的价值的贡献度,显然并不总是一样或相同的,因此,就涉及到对引用信息的重要性的判断,并将引用信息的重要性作为一个参数,在判断被分析专利P*的重要性/价值时予以考虑。
由于引用信息既可能是专利文献,也可能是非专利文献,鉴于专利文献与非专利文献的不同性质,其本身的重要性判断方法是不同的,限于篇幅,本文下面将仅针对专利文献类型的引用信息继续讨论。
在假定引用信息是专利文献的情况下,由于同样是专利,因而,其重要性/价值的判断,可以适用前面对被分析专利P*的价值或重要性判断方法,即:需要对(专利文献类型)引用信息的前向引用、后向引用情况进行统计和分析,进而获得当前被分析专利P*的引用信息的重要性。
这个时候,就会出现一个问题,由于引用信息可能是无限延伸的,即:当前被分析专利P*的后向引用BC可能也会有后向引用信息Pbc*和/或前向引用信息Pfc*,该后向引用信息Pbc*和/或前向引用信息Pfc*可能还会有后向引用信息P’bc*和/或前向引用信息P’fc*,如此持续追溯,以及,当前被分析专利P*的前向引用信息FC可能也会有前向引用信息Pfc*和/或后向引用信息Pbc*,该前向引用信息Pfc*和/或后向引用信息Pbc*可能还会有前向引用信息P’fc*和/或后向引用信息P’bc*,如此持续追溯。
限于时间和精力的限制,显然不可能做无止境的追溯,并且,应当可以理解的是,一般而言,离当前被分析专利P*的层级越远的引用信息,其对当前被分析专利P*的重要性的贡献度越小,是呈递减趋势的。
因此,为了能够充分考虑到引用信息对当前被分析专利P*的重要性的贡献度问题,建议分别从后向引用、前向引用再向后、向前双向延伸特定级数的层级,通过这种特定级数下的双向延伸,给每个与当前被分析专利P*有关的后向引用、前向引用赋予一定的权重,避免纯粹的“以引用数量取胜”,使被分析专利P*的重要性评价更趋合理。
(二)专利技术渗透转移
除了用于进行专利技术价值判断,专利引证信息还是用来判断不同国家、地区之间的技术渗透、技术转移情况的重要手段,下面同样仅针对专利文献类型的引用信息展开讨论。
对于被分析专利P*,对其后向引用信息的主要国别信息进行统计分析,可以判断该专利技术主要源自哪个国家或地理区域,这也从一定程度上反映出被分析专利P*在地理区域上的技术依赖性。
反过来,当被分析专利P*作为被引证信息时,其反映出来的,是被分析专利P*的技术在地理区域上的影响力、其技术渗透能力。可以想像,如果被分析专利P*被不同地理区域的专利文献用作引证信息,那么被分析专利P*则在该地理区域造成了技术影响,其技术渗透到该区域。显然,如果被分析专利P*的被引用覆盖地理范围越广,则其技术渗透能力、技术影响力相对越高。
最后,专利技术的渗透还体现在技术领域的渗透上,对于被分析专利P*,通过对其引证信息的分析,尤其是对其前向引用信息的聚类分析,可以统计出专利技术是否渗透到其它的技术领域,以及在所渗入技术领域的影响。
(三)专利技术聚集特性
此外,从更微观些的层面,还可以运用专利引证信息来判断专利的技术聚集特性,包括创新主体/申请人聚集特性、发明人聚集特性等,简述如下。
通过对被分析专利P*引证信息的分析,可以通过聚类的方式,统计挖掘引证文献的申请人信息、发明人信息。根据聚类结果,可以得出哪些申请人在专利技术所在的技术领域是活跃的、占主导地位的,并进而发现专利技术的聚集特性,比如是否仅集中在少数的几个企业、研究机构等。
此外,通过对引证文献中的发明人信息的聚类分析,还可以得出在专利技术领域中,主要的发明人都是哪些,据此可以做出进一步的相关决策。
四、结语与建议
专利引证信息是非常重要的技术信息,其不仅可以用于评价专利的价值/重要性,还可以用于判断专利技术的技术渗透、技术影响情况。不过需要注意的是,对于专利引证信息的利用,应当采用统计分析的方法,因为单个专利的引证信息往往难具代表性。通过运用数学方法,建立适当的统计模型,可以从不同的视角对专利引证信息进行统计分析与研究。
目前,国内关于专利引证信息的研究,尤其是实证研究尚不多见,有待加强这方面的努力。另外,虽然我国目前尚没有在公开/公告的专利文献著录项目中记载专利引证信息,但是,随着时间的推移和我国技术的进步,迈出这一步只是早晚的事情。值得注意的是,倘若将来决定公开专利引证信息,建议预先进行较细的分类并予以明确记载,同时在机检数据库中也应当予以标引,为日后对专利引证信息的最大程度利用奠定基础。