基于夹角离散度的文本相似度检测

来源 :2005年全国测控、计量、仪器仪表学术年会 | 被引量 : 0次 | 上传用户：bluelpower

【摘要】

：

文本相似度的检测是文本分类的基础,根据文本与各类的相似度运用检测理论,将其自动归到一个或者几个类别中去.本文改进了传统方法,将夹角离散度引入文本相似度的检测,提出新

【作者】

：

刘涛毛伟郭军

【机构】

：

北京邮电大学信息工程学院,北京,100876

【出处】

：

2005年全国测控、计量、仪器仪表学术年会

【发表日期】

：

2005年期

【关键词】

：

夹角离散度文本相似度分类算法检测理论文本开放文本分类分类性能法的实施测试结果准确率查全率测试集中文证明运用基础方法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本相似度的检测是文本分类的基础,根据文本与各类的相似度运用检测理论,将其自动归到一个或者几个类别中去.本文改进了传统方法,将夹角离散度引入文本相似度的检测,提出新的分类算法.针对中文文本开放测试集测试结果表明该分类算法查全率和准确率均有所提高,而且新分类算法的实施有效地改善了分类性能,证明了其有效性和可行性.

其他文献

培土蹲苗助青年干部快速成长

“给青年干部提供更多思考和展示的平台,形成互帮互促、你追我赶的良好氛围……”这是审计署驻成都特派员办事处(简称“成都办”)在《关于贯彻落实〈“十三五”国家审计工作

期刊

回首九八股市:非牛非熊的平衡市

1998年的中国证券市场比较平稳，但并不平静。二级市场没有走出像前两年那样波澜壮阔的行情，但也峰回路转，有声有色。资产重组在创造或企图创造一个个“化腐朽为神奇”的神话的同

期刊

大盘板块中国证券市场中国证监会证券市场配股股票上市规则会计估计变更证券期货市场会计差错更正

凝神聚力谋福祉久久为功砥砺行——审计署驻兰州特派员办事处开展政策落实跟踪审计纪实

2013年2月,习近平总书记视察甘肃省时发表重要讲话,提出加快建设经济发展、山川秀美、民族团结、社会和谐的幸福美好新甘肃,努力到2020年同全国一道全面建成小康社会的奋斗目

期刊

审计署兰州特派员办事处政策落实生态环境保护甘肃省政策措施经济发展跟踪审计总书记习近平审计监督职能基础设施建设追踪问效重要讲话中心

桥式无源无损耗拓扑研究

在上述理论分析的基础上,本文提出了一种新型的适用于电压源桥式逆变电路的无源无损耗吸收能量回馈结构.详细描述了其拓扑特点、工作原理.在吸收结构基础上,提出一种无源无损

会议

桥式逆变电路无源无损耗吸收吸收能量能量回馈拓扑特点理论分析结构基础回馈结构工作原理电压源描述方法

一种电容器寄生电感及等效串联电阻的测试方法

在开关电源及其它功率电子装置中,存在着电容器的等效串联电阻及寄生电感,如果电路参数设计不合理,它们会对电路中的某些元器件和电路性能造成严重的影响.本文介绍了电容器寄

会议

电容器寄生电感等效串联电阻电路性能简易测量方法功率电子装置开关电源工程应用测量精度测量电路参数设计元器件示波器

报警信号测量与分析

本文主要针对振动传感电缆报警信号测试结果进行分析,由于传统分析方法的识别信号准确率不高,本文提出对各种报警信号按照各自的频域特征进行判断和识别,可以从很大程度上减

会议

报警信号振动传感电缆识别信号功率谱分析识别方法频域特征分析方法测试结果准确率工具包语言误报工程程度

类推思维在审计查找案件线索中的应用

类推,即类比推理,也简称类比,是根据两个或两类对象有部分属性相同或类似,从而推断它们的其他属性也相同或类似的一种或然性推理形式.它的基本逻辑模式是:A事物具有属性a,b,c

期刊

企业内部审计质量控制探索

内部审计质量控制是由内部审计机构对内部审计的各种业务活动或行为进行有计划的监督检查,从而实施全面控制管理的行为.审计质量是一个审计项目的基础,审计质量控制的好坏是

期刊

坚定自信奋勇前进——刘家义在中共审计署党校主讲“两学一做”学习教育专题党课

5月10日,审计署党组书记、审计长兼中共审计署党校校长、审计署审计干部教育学院院长刘家义为中共审计署党校第一期培训班——2016年度党员干部专题培训班暨“两学一做”示范

期刊

论集体目标与个人目标的有机统一——读《你在为谁工作》有感

最近读的《你在为谁工作》(陈凯元著,机械工业出版社200 5年出版)这本书,对我的触动很大.书中陈述了这样一段话:“工作是一个施展自己才能的舞台.我们寒窗苦读来的知识,我们

期刊

基于夹角离散度的文本相似度检测

与本文相关的学术论文