【摘 要】
:
[目的/意义]针对专利文本主题建模中领域停用词自动选取尚未有充分研究的问题,提出一种新的领域停用词自动选取方法,用于专利文本主题模型分析,以提高专利主题模型的区分度与
【机 构】
:
南京工业大学信息服务部 南京210009东南大学成贤学院电子与计算机学院 南京211816;南京工业大学信息服务部 南京210009;
论文部分内容阅读
[目的/意义]针对专利文本主题建模中领域停用词自动选取尚未有充分研究的问题,提出一种新的领域停用词自动选取方法,用于专利文本主题模型分析,以提高专利主题模型的区分度与建模质量.[方法/过程]领域停用词本质上是信息比较少,在不同类别专利文本中区分度低的词.因此,引入辅助专利文本集,使用类别熵衡量词的分布情况,然后依据词的类别熵进行排序,选取类别熵最大的若干词作为领域停用词.[结果/结论]实验通过专利文本数据,验证了该方法的可行性与有效性,能够有效地提高专利主题模型的区分度.
其他文献
[目的 /意义]探究我国为实现促进大数据发展的政策目标而构建的政策工具选择体系结构,揭示大数据政策工具选择中存在的问题,为优化我国促进大数据发展政策工具选择提供建议。
摘 要:地铁线路作为民生工程,其安全稳定运行是确保日常出行需求得到满足的关键,随着地铁承载量的不断增加和地铁运营难度的提升,对地铁安全质量控制提出了更高的要求。地铁接触网作为地铁的重要组成构建,其施工质量直接地铁系统运行的整体安全。本文以成都地铁2号线为例,对地铁接触网关节式刚柔过渡施工技术、装配要点及质量控制措施进行分析,以期为地铁建设和运维人员提供参考。 关键词:地铁接触网;关节式;刚柔过渡
电子政务中的政府信息公开网站在方便企业和百姓并且获得社会好评的同时,也激发了公众更高的期望和期待。据《中国地方政府透明度年度报告(2009年)》显示,半数以上政府门户网站
[目的/意义]以现有图书馆借阅记录为基础,结合图书阅读相关性进行深入挖掘,探讨识别借阅场景下图书专业性质量和实现相应个性化图书推荐服务的有效方法.[方法/过程]利用图书
一、微视频在高中化学教学中的应用现状rn1.学生现状rn现代通信技术和移动终端走进每一个学生的生活,随着科技的发展,学生网络使用的频率加大.超过50%的学生每天上网的时间超
[目的/意义]以高等专科学校向本科院校转型升级期图书馆精准服务方法研究为目的,通过研究成果的应用与实践,为专升本类转型期高校的图书馆实施快速转型提供一种可借鉴的精准
随着我国教育的不断改革,学生的素质发展越来越受到学校的重视,课业繁重的高中也不例外.在新背景下,原来被忽视的体育教学逐渐被人们所重视,高中足球发展势头越来越好.本文基
[目的 /意义]通过对美国数字素养发展现状的梳理,引发对我国数字素养教育的思考,并提出相应的对策和建议。[方法 /过程]针对美国的数字素养网站、教育资源、政府法案以及行业