【摘 要】
:
为了解决基于VSM方法在进行短文本分类时存在的严重数据稀疏问题,提出了基于语义与最大匹配度的短文本分类方法。以《知网》为知识源,设计了基于义原距离、义原深度与区域密
【机 构】
:
北京信息科技大学网络文化与数字传播北京市重点实验室
【基金项目】
:
国家自然科学基金项目(61271304);北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)
论文部分内容阅读
为了解决基于VSM方法在进行短文本分类时存在的严重数据稀疏问题,提出了基于语义与最大匹配度的短文本分类方法。以《知网》为知识源,设计了基于义原距离、义原深度与区域密度的义原相似度计算方法,实现基于词类的词语相似度计算;提出了基于语义与最大匹配度的方法计算短文本相似度,应用KNN算法进行短文本分类。实验结果表明,该方法与基于语义、基于AD_NB等方法相比,正确率、召回率和F值均得到了明显的提高。
其他文献
<正> 埃及伊蚊是西太区登革热和登革出血热最重要的媒介之一。在马来西亚这二种疾病常发生暴发流行,是一种严重的公共卫生问题。由于昆虫对化学杀虫剂产生抗性,使得
1910年,纽约州成为第一个颁布法律禁止酒后驾驶的州,开启了治理酒驾的先河。此后,治理酒驾的法律、法规、标准等不断完善,从各州政府到社会团体,在酒驾治理方面倾尽无数心血,
在后危机时代,物流企业面临着生存和发展的困境。物流企业应基于核心竞争力发展的需求,进行文化建设的思考,充分发挥企业领导者自身的"领跑"作用,重视"本土化"的文化因素,注
运用文献资料、逻辑分析等方法,对影响特殊教育学校体育教育发展的因素进行全面、深入的分析,认为特教体育课程教学改革滞后;师资短缺且体育教师专业素质普遍偏低;体育经费和
<正> [日本《日本原子》1994年3月报道] 3月9日,日本科学技术厅(STA)下属的国家放射性科学研究所(NIRS)开始使用位于千叶的重离子医疗加速器(HIMAC)为癌症治疗进行临床前的试
<正>70年砥砺奋进,70年铸就辉煌。从1949年至2019年,久经磨难的中华民族实现了从站起来、富起来到强起来的历史性飞跃。在这个令人瞩目的伟大进程中,无数中华儿女用生命和热
目的:观察高能聚焦超声刀对晚期胰腺癌止痛的疗效及安全性。方法:应用高能聚焦超声刀治疗晚期胰腺癌31例。结果:超声引导焦点定位精确可靠,高能聚焦超声刀具有无创安全、无并
随着海洋资源开发与海底环境监测技术地不断推进,各种海洋测试装置应运而生,其中海洋原位声学测试装置是释放在浅海海底,通过对海底底质进行取样分析,以及对沉积物的声学特性
文章从佚著溯源、求学经历、思想轨迹及学术交往等方面考论了魏源佚著大多作于早期求学时期,且多是治经之作,然后分别论述了存书名的佚书《高子学谱》《春秋繁露注》《墨子注
防沉板是水下生产系统的重要基础形式,在海洋工程开发中有着广泛应用。基础承载能力不仅决定防沉板的适用范围,还关乎水下生产系统的稳定性与安全性。随着人类对海洋的开发逐