【摘 要】
:
专利数据包含了各种丰富的信息。通过对专利数据聚类,可以将它们划分为语义或结构上相似的子集,从而为发现数据中所蕴含的有用模式和知识提供更为深入的洞察力。传统的专利数据
【机 构】
:
杭州市科技信息研究院,浙江大学计算机学院
论文部分内容阅读
专利数据包含了各种丰富的信息。通过对专利数据聚类,可以将它们划分为语义或结构上相似的子集,从而为发现数据中所蕴含的有用模式和知识提供更为深入的洞察力。传统的专利数据聚类方法通常只是利用专利数据的某项属性实现聚类,没有充分利用专利数据所包含的多种丰富信息。本文针对现有专利数据聚类方法的不足,提出了一种综合利用专利摘要文本和IPC分类号的专利聚类方法PDICluster。该方法通过解析IPC分类号中包含的树型结构信息,利用树距离度量专利数据之间的相似性,并综合专利摘要文本相似性和IPC分类号相似性信息来实现专
其他文献
<正>一、汉堡自由港管理汉堡是德国第二大城市,是东欧和北欧与世界进行贸易活动的枢纽。汉堡港港区面积74平方公里,约占全市面积的1/10,2005年,汉堡港凭借总吞吐量1.26亿t、8
建立了测定食盐中痕量砷的氢化物发生-原子吸收法,探讨了盐酸、硼氢化钾溶液浓度以及样品还原处理对测定结果的影响,测定结果的相对标准偏差(n=6)小于2.23%,回收率范围为93.2
<正>中国社科院经济所所长高培勇日前在"中国财富管理50人论坛2017北京年会"上,就金融如何支持实体经济的问题发表观点称,在当前形势下,金融支持实体经济最要抓紧的一件事情
生物柴油是一种对环境友好的绿色可再生能源,是石油燃料的理想替代品。目前用于制造生物柴油的方法主要有化学法、生物酶法、超临界法。将生物酶法与化学法及超临界法进行了
以黑线仓鼠(Cricetulus barabensis)为对象,采用RT-PCR技术克隆黑线仓鼠GAL cDNA序列482 bp,采用生物信息分析软件对GAL进行基因序列分析表明,结果显示GAL包括完整CDS区375 b
在谱映射的基础上,根据节点到社团的谱映射距离提出了节点的重叠度函数,能够准确地衡量节点与各社团的连接紧密程度,以此得到复杂网络的重叠社团结构。进一步由于经典NG模块度无
K2代数概念是Koszul代数和d-Koszul代数的推广.Koszul代数和d-Koszul代数的PBW-形变受到了广泛的研究.在连通分次代数的PBW-形变理论的框架下,该文明确地刻画了一类K2代数B1
本文选取了审核实践中几个有代表性的案例,从案例事实分析的角度,深入浅出地说明了管理体系文件的评审过程对于保持文件适宜性、有效性的重要作用;并根据案例所示,将文件评审
1育雏前的准备工作育雏前要对育雏室进行全面检查,修补有破损的地板和墙壁,使室内无"贼风"、无鼠洞。进雏前2~3天要对育雏室内外进行彻底的清扫消毒,用10%生石灰水或3%草碱水,或
证候类中药新药的开发引起业界的广泛关注,但其研究却始终未能突破瓶颈.本文从研究模式、临床定位、证候选择、疗效评价等方面探讨证候类中药新药的临床研究,并提出了基于“