结合邻居辅助策略的两阶段层次文本分类模型

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zhangnaiyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统两阶段层次文本分类模型(THTC模型)是一种解决大规模层次文本分类问题的有效方法,但该模型的分类准确率仍然不是很高。为了缓解这个问题,提出了结合邻居辅助策略的两阶段层次文本分类模型(THTC-NA模型)。THTC-NA模型由搜索阶段和分类阶段组成。搜索阶段采用扁平策略从所有的叶子类别中选择与待分类文档最相关的k个类别作为候选类别集,这样可以大大减小分类阶段的搜索空间。分类阶段通过结合候选类别的祖先类别和兄弟类别的分类结果来帮助计算候选类别在分类阶段的结果。最后将搜索阶段的结果和分类阶段的结果融合起来共
其他文献
猪丹毒为传统细菌性疾病,可以使用抗生素进行治疗。所以在免疫程序的安排上,不被重视。现介绍一例猪丹毒的病例,其防控措施供同行们参考。1发病情况养殖户反映,50~100kg猪突发高烧
中外学界对"海上丝绸之路"的研究历久弥新,成果斐然。然而这些研究更偏重于对"海上丝绸之路"南海航线的考察,对其他航线的研究却相对薄弱。为满足中国市场对海参的巨大需求,
土壤施肥量的多少是影响土壤肥沃程度高低的关键因素之一,对土壤施肥过程合理、有效的掌握能在农作物的生长过程中为作物生长提供所必须的能量和促进其健康生长的营养物质,能促
反全球化浪潮源于国家之间与国家内部的利益博弈和权力斗争,因而其后果也是跨层次的。目前学界对金砖国家合作的研究大多只停留在体系层次,缺乏跨层次的理论分析。现有的跨层
安全标记与信息客体绑定,一直是制约多级安全走向网络实用化的关键问题。针对这一问题,提出了一种基于信息客体统一化描述的安全标记绑定方法。通过分析客体类型,给出了基于数据
焚烧秸秆会对大气产生严重污染,危害人体健康,及时准确获得焚烧秸秆的位置信息显得尤为重要。这对秸秆焚烧定位系统的定位精度要求很高。传统的DV-Hop算法定位误差很大,秸秆焚烧
园林街道绿化,可以有效改善人们的生活环境、改善城市环境,增加城市绿地面积。文章主要分析了园林街道绿化中园林机械的概况、要求、现状及发展。
明末,开洋已是闽海士人们的共识,但国家政策仍在开海与禁海之间反复变动。在东西海洋势力竞逐的明末,开海与否取决于明朝能否控制住东南海洋秩序。通常来说,实行开海政策意味