基于关键词加权的法律文本主题模型研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:systemlu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了降低法律文本中的无关词语对分类的影响和突出法律关键词汇的作用,采用主题模型建立一种基于法律词汇加权的文本分类模型。针对不同类别的法律文本的关键词的不同,在主题模型中提出了按关键词标记词到主题的文本集,并进行权值学习,用权值更新文档到主题的分布,从而提高了文档相似度计算的准确性。通过在Westlaw真实数据集上的计算分析,与传统的主题模型相比,加权的主题模型可以获得较好的困惑度和文本相似度。
其他文献
【摘要】古诗是一种独特的文字呈现方式,也是基础教育阶段语文课程教学中不可缺失的部分。在小学阶段注重对古诗教学策略的优化,不仅可以增强学生的文化审美和传承能力,而且可以促进学生正确价值观念的养成,助力学生的全面健康发展。而国家新一轮课程改革强调,要加强信息技术与学校课堂教学之间的整合,提升教育与社会之间切合度,实现教学方式和学习方式的根本变革。作为一名小学语文教师,应积极利用信息技术教学优势,优化教
在含多微源的配电线路系统中,对等控制是使各微源有效协调、系统安全稳定运行的控制策略之一.在对等控制策略中,各微源均采用下垂控制方法.针对传统的下垂控制存在输出阻抗性
冷链物流引起了当前物流业的广泛关注。论文首先介绍了冷链物流的基本概念:之后分析了当前制约我国冷链物流发展过程中存在的一些问题.并重点就物流配送过程进行了研究:然后提出