文本分类系统SECTCS中若干技术问题的探讨

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:joui248369
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 SECTCS是笔者在深入研究各种文本分类方法的基础上实现的一个中英文文本分类系统。它集成了质心分类、K近邻分类和朴素贝叶斯分类器等多种文本分类方法,在大规模文本分类实验中表现出良好的性能。该文结合以该系统作为测试平台所得到的各种实验结果,对系统中涉及的若干重要技术问题进行探讨和分析,力图得到一些有价值的结论,希望能够对相关研究工作提供可借鉴的依据。
  关键词 文本分类 VSM KNN Naive Bayes分类器
  文章编号1002—8331—(2003)11—0080—04 文献标识码A 中图分类号TP391
其他文献
摘 要 文章给出了一种基于人工神经网络与证据理论相结合的数据融合中的辐射源识别方法及其结构,并分析了该方法的性能。文中给出了实例,通过这个实例可以证明该方法在强噪声环境下具有良好的适应性,并可以得到较高的识  关键词 神经网络 证据理论 数据融合 模式识别  文章编号1002—8331—(2003)03—0208—03 文献标识码A 中图分类号TP391;TPl83
期刊
摘 要 在有色Petri网的状态空间中,有时一些状态具有相似的行为,这些状态可以用定义在状态空间上的一致的等价关系来表达,对每个等价状态类只研究它的一个代表状态的行为,这极大地减小了有色Petri网的状态空间。但是,通常对一个给定的等价关系是否为一致的验证都是通过用户的经验人工进行的,这不但容易产生错误,而且效率低下。该文依据普通状态图和等价类状态图的标记迁移系统关系,对状态空间一致性等价定义
期刊
摘 要 相对于伪随机序列(PN)码,混沌序列码具有较好的自相关和互相关性能,它有望替代PN码在直序扩谱码分多址(DS-CDMA)通讯系统中得到应用,以提高通讯系统的容量及性能。该文通过介绍IS—95 CDMA的标准,说明了混沌数字CDMA的兑现原理,并以蔡氏混沌电路为例,分析了混沌序列信号的随机性和相关性及其电路的同步功能。最后,通过计算机数值仿真来进一步验证混沌随机序列在DS—CDMA系统中
期刊
摘 要 该文针对银行票据识别系统中的手写数字的识别问题,利用神经网络和支撑向量机相结合的方法构建了手写数字的识别核,并利用支撑向量机对神经网络输出的识别结果中的相似字进行了二次识别,解决了于写数字中相似字的识别问题,最终的单字误识率达到2.0426%-5.4369%,满足了银行票据识别系统中的手写数字识别的实际要求。  关键词 手写数字 神经网络 支撑向量机 识别 票据处理  文章编
期刊
摘 要 计算机对等联网(peer-to—peer network,P2P)技术是一项新型网络应用技术,而JXTA技术是由Sun微系统公司推出的一项致力于为P2P应用提供所需基础服务的新技术。该文着重介绍了JXTA技术的体系结构和核心协议,分析了其可行性,并对其未来发展前景进行了展望。  关键词 计算机对等联网 JXTA技术 对等点 对等组  文章编号1002—8331—(2003)11
期刊
摘 要 该文介绍了一种基于80C32单片机的MS-2000型全自动穆斯堡尔谱仪的硬件原理。该谱仪具有掉电时谱数据保护功能、上电时自动恢复测谱功能、多样品的自动连续测谱功能、通用计算机遥控及数据通信功能。该谱仪有很高的自动化水平和数据处理能力。  关键词 单片机 穆斯堡尔谱仪 硬件  文章编号1002—8331—(2003)11—0045—04 文献标识码A 中图分类号TP273;TP
期刊
摘 要 针对利用三维CT设备对空心涡轮叶片进行无损检测时存在的定位偏差问题,提出了一种基于三维数字样品的图像模型匹配方法,这对于充分利用有关叶片的先验知识,建立叶片无损检测专家系统具有重要的意义。该方法首先通过图像模型的一阶矩,进行灰度重心匹配;然后将叶片的图像模型与其CAD理论模型之间的残差平方和定义为优化目标函数,采用黄金分割方法搜索其极小值;同时利用叶片上预先指定的结构特征,求出空间变换
期刊
摘 要 指挥控制是C31系统的核心功能,指挥控制软件的开发是C3I系统开发的关键。应用UML对指挥控制软件进行开发,能有效地增进各类人员之间的交流,提高软件的一致性和可重用性,并降低风险。该文首先简要介绍了UML技术及其在开发应用程序中的一般框架,并以此为依据,使用UML对指挥控制软件开发进行建模,给出了基于UML的指挥控制软件的分析阶段描述。  关键词 统一建模语言 指挥控制软件 建模
期刊
摘 要 该文提出了基于分组密码算法Rijindael的安全Hash函数。此Hash函数基于分组长度和密钥长度均为256比特的分组密码算法Rijindael—(256,256),其输出长度为256比特。并且该文证明了此Hash算法抵抗碰撞及作为单向函数的安全性。  关键词 Rijindael Hash函数 抵抗碰撞 单向函数 安全性  文章编号1002—8331—(2003)11—00
期刊
摘 要 该文设计了求解平面TSP的一种新算法,该算法首先构建一个“基因库”,在单亲演化中使用“基因库”中的基因,并将单亲演化所产生的最好解,作为群体演化中的一个个体,再进行群体演化。在求解TSP Chinal44问题实验中,不仅找到迄今最好的解,而且该算法具有高效的特点。  关键词 单亲遗传算法 TSP问题 基因库  文章编号1002—8331—(2003)11—0075—02 文献标
期刊