基于知网的概念特征抽取方法

来源 :通信学报 | 被引量 : 0次 | 上传用户：philippetr

【摘要】

：

文本特征抽取是文本过滤的一项重要基础,但通常采取的用字、词作为特征项的显著缺点是无法表达文本的语义信息,所以本文在向量空间模型的基础上提出了一种以知网为语义知识库

【作者】

：

赵林胡恬黄萱菁吴立德

【机构】

：

复旦大学

【出处】

：

通信学报

【发表日期】

：

2004年7期

【关键词】

：

文本过滤特征抽取向量空间模型知网

【基金项目】

：

国家信息安全保障持续发展计划基金资助项目;国家自然科学基金资助项目(69873011,69935010,60103014);国家“863”基金资助项目(2001AA114120,2002AA142090)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本特征抽取是文本过滤的一项重要基础,但通常采取的用字、词作为特征项的显著缺点是无法表达文本的语义信息,所以本文在向量空间模型的基础上提出了一种以知网为语义知识库、基于语义信息的文本特征项抽取方法.该方法比单纯的词汇信息更能体现文本的概念特征,提高过滤系统的性能;同时还能降低文本向量的维数,减少计算量,提高过滤效率.我们在引入了该方法的中文文本过滤系统上进行的实验结果也充分证实了其有效性.

其他文献

应用于桥梁支座更换的超高精度液压同步顶升系统

该论文研究了一种应用于桥梁支座更换的同步顶升系统。通过设计液压控制系统和控制策略，使顶升千斤顶的同步精度达到±0.5mm，避免了桥面板在顶升或下降过程中桥面板开裂风

期刊

同步精度系统设计控制策略功能实现

毛泽东、邓小平建党思想研究

本文从历史条件、理论构成、建党策略方面对毛泽东、邓小平的建党思想进行了分析研究。作者认为,毛泽东、邓小平的建党思想是中国式的马克思主义建党理论,它们以鲜明的民族特

期刊

毛泽东建党思想马克思主义建党学说马列主义建党学说民主集中制原则无产阶级政党党的政治路线整党整风马克思主义建党理论

高科技产业园的多层面“绿色化”——以南京中环光伏科技产业园为例

本文通过调研南京工业产业园的现状,并分析了一个绿色科技产业园的实例,提出了一套科技产业园的"绿色化"途径和专门针对绿色科技产业园的评级标准。在强调绿色产业园应从园区

会议

绿色科技产业园绿色工作方式绿色运营管理方式评价标准

保留乳头乳晕复合体假体再造乳房联合前哨淋巴结活检在早期乳腺癌治疗中的临床应用

目的探讨保留乳头乳晕复合体(NAC)I期假体再造乳房联合前哨淋巴结活检(sLNB)在早期乳腺癌治疗中的临床应用。方法 2006年3月—2013年5月,收集42例早期乳腺癌患者在前哨淋巴结

期刊

乳腺癌前哨淋巴结活检假体植入Ⅰ期乳房再造

浅谈企业技术开发费

技术开发费也是新税制下改革的问题,无论是从其范围的确定、税收筹划,还是计算基数,历来都有些分歧.本文通过对新税法关于技术开发费的解读,对其有一个新的认识。

期刊

技术开发费技术开发费范围税前扣除技术资本化费用化

海派文化:徐汇公共文化服务体系建设的名片

地域文化资源是特定区域独具特色、传承至今的文化资源,上海市徐汇区是海派文化的摇篮,本文试图从利用地域文化资源的角度阐释徐汇区充分发挥海派文化的资源优势,构建公共文

期刊

地域文化海派文化公共文化服务

空中网：用NBA撬开无线互联网大门

<正>10月28日,NBA新赛季大幕拉开。空中网旗下的NBA中文手机官网(cn.nba.com)将继续直播本赛季全部赛事,同时还在开幕战当日隆重推出国内首款手机版梦幻NBA经理线上互动游戏

期刊

空中网NBA无线互联网

递阶偏最小二乘回归在大坝安全监测中的应用

偏最小二乘回归能有效地消除因子间的多重相关性，但从其算法特点和实际应用来看，也存在不足。例如，在算法方面，偏最小二乘提取的主成分不一定能同时保证方差和相关程度最大；在应用

期刊

大坝安全监测逐步回归偏最小二乘回归递阶偏最小二乘回归

突发性耳聋的心理护理分析

目的:探讨对突发性耳聋患者实施心理护理分析及护理措施的效果。方法:回顾性分析2012年1月-2013年1月于笔者所在医院耳鼻喉科就诊的302例突发性耳聋患者的临床护理资料。结果

期刊

突发性耳聋心理护理

浅析新资产减值准则及其对企业财务的影响

2006年2月15日,我国财政部发布了《企业会计准则第8号—资产减值》(以下简称"新资产减值准则")等相关会计准则,这些准则详细地规范了资产减值损失的确认、计量和相关信息的披

期刊

资产减值企业财务影响

基于知网的概念特征抽取方法

与本文相关的学术论文