基于特征选择的Web服务分类

来源 :天津大学 | 被引量 : 0次 | 上传用户:zhang11289
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算的发展使得Web服务技术的重要性日益显著。随着Web服务数量激增,建立高效的存储和管理机制逐步成为服务注册中心(UDDI)的主要研究问题。Web服务分类是 Web服务在 UDDI注册后的第一步处理工作。先借低端UDDI仍采用人工指定的方法添加类标签,这种方式缺乏系统的管理模式,不适用于后续的Web服务发现和组合的自动化,因此本文提出了一个Web服务自动分类机制。  本文首先研究了 Web服务文档建模方法。Web服务文档详细描述了该服务的功能,可以从中抽取关键词作为属性进行文档建模。常见的TF-IDF根据词频来衡量一个 term 对该文档的重要性。但是随着互联网的发展仅仅依靠词频的方法已经不足以来刻画文档特征,term间的语义关系更能体现文档在特定领域内的联系。本文以文本挖掘的方法为基础,采用TF-IDF与语义相似性加权的方法来建立文档的空间向量模型。同时提出了一种新的计算信息量的方法计算语义相似度。该方法利用otology的层次结构,根据概念在otology中的结构特点和关联关系定义其所具有的信息量,进而通过对最小公共节点信息量的共享程度获得两个词之间的语义相似度。将本文的方法与人工判断的结果进行比较根据相关系数验证本文方法的有效性。  其次,为了提高分类准确率,降低数据维度,区分每个类中特征的不同鉴别能力,本文使用了基于类的特征选择方法,使用多目标+遗传算法(GA)+神经网络(RBF)的方法进行特征方案的评价和选择最终得到优化后的特征子空间和RBF分类器。使用该特征子空间和分类器对测试集进行分类实验。  实验中采用OWLS-TC 4.0中的数据进行验证,以分类的准确率(accuracy)和敏感度(sensitivity)为指标对本文设计的算法进行评估。实验结果说明本文提出的TF-IDF与语义相似性加权的建模方法可以改进分类的准确性,提高对当前类的鉴别能力。同时特征选择的加入进一步提高了分类器在两个指标上的表现。证明该方法可以有效得改进Web服务管理机制。
其他文献
我国房地产业在促进国民经济发展的同时,也承载不少社会矛盾和社会情绪,公众对房地产企业缺乏全面客观的认识,有时会把一些不应由企业承担的社会责任归咎于房地产企业。因此
由无锡市曲艺家协会、无锡阿福吉祥幽默俱乐部出品,无锡大阿福文化发展有限公司与上海评弹艺术传习所共同创作的中篇评弹《徐悲鸿》,获得了第九届中国曲艺牡丹奖节目奖,这对于诠释与理解联合国教科文组织所强调的“非物质文化遗产的动态性和活态性应始终受到尊重,本真性和排他性不应构成保护非物质文化遗产的问题和障碍”的伦理原则,具有一定的认知价值。  所谓伦理原则,是指不分国家、地区和民族都应该主动遵循的人与人以及
期刊
随着现代企业制度在国内的建立,高管人员薪酬激励问题已经成为学术界和实务界普遍关心的话题。合理的薪酬激励机制能有效提高高管人员的工作效率,从而降低代理成本。因此,研