【摘 要】
:
设计并实现了带有主题词结构的政府公文分类系统,在公文分类预处理过程中充分利用主题词所携带的类别信息,运用随机关键词产生技术和Bootstrapping学习方法对公文文本特征空间进行转换并降维,实现了一个不同于传统的文本分类预处理过程,使公文分类系统的性能得到了提高。基于随机关键词产生技术和Bootstrapping学习方法的公文分类系统分类效果优于普通分类器。
【机 构】
:
辽宁金融职业学院信息技术系,东北大学信息科学与工程学院
论文部分内容阅读
设计并实现了带有主题词结构的政府公文分类系统,在公文分类预处理过程中充分利用主题词所携带的类别信息,运用随机关键词产生技术和Bootstrapping学习方法对公文文本特征空间进行转换并降维,实现了一个不同于传统的文本分类预处理过程,使公文分类系统的性能得到了提高。基于随机关键词产生技术和Bootstrapping学习方法的公文分类系统分类效果优于普通分类器。
其他文献
目的探讨以Tie2为靶点的基因治疗对结肠癌生长及肝转移的抑制作用。方法构建表达Tie2胞外可溶性片段(sTie2)的慢病毒载体pLenti-sTie2,建立BALB/C小鼠结肠癌皮下成瘤模型及肝转移模型。经尾静脉注射重组病毒载体,在不同时间点分别测量皮下移植瘤体积、经ELISA法检测小鼠血中sTie2的表达水平。2周后处死小鼠,观察肝转移的情况,并取瘤组织检测血管形成和细胞凋亡指标。采用SPSS
提出了一种新的基于区域形心及其矢量方向的视频对象跟踪算法。视频对象分割后,使用区域增长法将视频对象分成若干个区域,然后利用视频序列连续两帧中每个区域的形心及形心间矢量的方向,快速、有效地自动跟踪多个目标对象。实验结果表明,该算法对运动物体的出现和消失,以及非刚性物体的尺度变化和变形,具有较强的鲁棒性。
在高噪声环境下,实现远距离通讯是十分困难的。为了解决这一问题,本文提供了一种硬件以隔离电流环,软件以抗干扰通讯指令的解决方案。在高噪声的环境中,和传统485方式进行了对比
探索分布估计算法中基于群体递增学习算法在优化癌症化疗中的应用能力,并与遗传算法作相应比较。实验表明基于群体递增学习(PBIL)算法的搜寻速度以及搜寻到的可行解质量均优于遗传算法。
Rough集理论是一种处理不完备信息系统的数学工具,但是Pawlak的经典rough集理论似乎是不可行的,因为它要求论域中数据间有很强的等价关系。在产生基本集(相似类)时,一般相似关系的分类误差较大,集对分析会把两个对立度不为0的个体划分在一起。汲取两者的优点,给出相同度的概念,只有满足一般相似关系并且相同度大于或等于阈值α的两个对象才能划分在一个基本集中,在此基础上建立基于α相同度相似关系的ro
目的 探索解决泪囊阻塞的新手术方法、分析其治疗难点.方法 采用经鼻内镜鼻内开放手术治疗慢性泪囊炎、面部外伤和手术等多种原因导致的鼻泪管阻塞16例(16眼),术后常规泪道冲洗
结合文本分类规则抽取的特点,给出了近似规则的定义。该方法首先利用CHI值进行特征选取并为下一步特征选取提供特征重要性信息,然后使用粗糙集对离散决策表继续进行特征选取,最后用粗糙集抽取出精确规则或近似规则。该方法将CHI值特征选取和粗糙集理论充分结合,避免了用粗糙集对大规模决策表进行特征约简,同时避免了决策表的离散化。该方法提高了文本规则抽取的效率,并使其更趋实用化。实验结果表明了这种方法的有效性和
在开放的服务网格中,为不同管理域之间建立信任关系并以此实现它们之间的协同工作是当前服务网格所面临的一个主要安全问题。为了提高服务网格的安全性和可扩展性,文中提出了一个服务网格环境下基于行为的分层信任模型,用以解决处于不同管理域的实体之间协同工作的安全问题。模型上层建立和维护具有不同安全策略管理域之间的推荐信任关系,下层负责处理管理者对域内实体的信任评估问题。在利用推荐信任值建立管理域间关系的过程中
运用粗糙集,结合遗传算法理论,提出一种提取大型数据表决策规则的方法。首先依据条件属性的重要度,把条件属性加入到核属性集中,生成约简。然后选取一组规则编码作为原始种群,应用遗传算法寻求最优解。经过解码和分析做出推理和决策。
当前Web搜索引擎返回的搜索结果一般是按“超链分析”进行排序的。采用词频统计、词分布特征量等方法对Web搜索引擎的搜索结果的关键词相关度进行计算,并重新对搜索结果排序,可以使得搜索结果中有关的页面文集更加集中。从而方便了信息的使用,特别是在对于特定内容的信息搜索时。