【摘 要】
:
【目的】针对如何确定专利发明等级,提出一种基于机器学习分类算法的专利发明等级分类模型。【方法】从专利文本中提取技术特征词,利用Word2Vec训练的词向量模型构建专利技术
【基金项目】
:
北京市社会科学基金项目“要素异质性视角下京津冀现代制造产业转移路径研究”(项目编号:15JGB124);北京市自然科学基金项目“基于技术交易数据的京津冀科技协同创新潜力挖掘”(项目编号:9172002)的研究成果之一
论文部分内容阅读
【目的】针对如何确定专利发明等级,提出一种基于机器学习分类算法的专利发明等级分类模型。【方法】从专利文本中提取技术特征词,利用Word2Vec训练的词向量模型构建专利技术特征向量,计算专利文本指标和后向引用指标,构造模型训练数据集,采用机器学习分类算法构建分类模型。【结果】获取语音识别技术领域相关专利,对领域专利数据分类,高等级与低等级发明专利占比约为1︰4,符合实际情况,证明了该模型可行性。【局限】由于使用了Word Net词典,对于技术特征词汇的抽取会受到词典收录局限的影响。【结论】该模型可以对专利进行发明等级分类,从而为企业推荐高发明等级的专利。
其他文献
财务管理一直是企业经营发展过程中的关键环节,如何结合建筑装饰企业的发现现状,围绕其生产经营的特点开展其内部财务管理工作,是每一个建筑装饰企业内部控制工作中的艰巨性
农村公共产品与服务存在供给不足的问题,在我国长期没有得到有效解决。一方面是由于政府投资不足,另一方面是供给由政府包办而利用非政府力量不足。一种传统的观念是政府安排
网络虚拟财产继承是我国《继承法》修改中难以回避的议题之一。基于概念明晰性、规则可操作性和体系完备性的立法要求,虚拟财产须具体化为"虚拟入口"和"虚拟资产"两类财产,并
GRC板材以硅酸盐水泥为基体,以耐碱玻璃纤维、通用合成纤维、各种陶瓷纤维、碳和芳纶等高性能纤维、金属丝以及天然植物纤维和矿物纤维为增强体,加入填加剂的环保,工厂顶制的
绘画艺术是中华民族传统艺术的瑰宝,中国题画诗绘画艺术在汉语作为第二语言的教学中有着十分显明的辅助作用。题画诗用生动的艺术形象使汉语言生成的方块字辉映着悠久的中华
<正> 日本渔业的历史悠久,沿岸近海和远洋渔业都非常发达,是世界上最大的渔业国,它比别的国家更多地依靠鱼品来供给人们对动物蛋白的需求.日本拥有先进的渔船及装备,全国渔船
讨论了Fries重排反应的机理以及酚酯的结构、催化剂的选择及反应温度对反应的影响,并介绍了此重排在有机合成中的应用。
"丝绸之路"教育援助计划是《推进共建"一带一路"教育行动》的引领性举措。我国开展对外教育援助面临一系列挑战,这将不利于教育援助的可持续发展。教育援助计划应从政府支出