基于文本分类中特征提取的领域词语聚类

来源 :语言文字应用 | 被引量 : 0次 | 上传用户:hlf00852
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以领域特征明显的词和短语作为聚类对象,在分类系统的大规模语料库中,利用文本分类的特征提取方法进行词语的领域聚类,从而获得大规模的领域知识,用于文本分类和主题分析。 In this paper, words and phrases with obvious domain characteristics are used as clustering objects. In the large-scale corpus of classification system, the method of feature extraction based on text categorization is used to cluster the words in terms of domain so as to obtain large-scale domain knowledge for text categorization and Theme analysis
其他文献
认知学习理论的一个重要分支——建构主义认为,学习并非对于教师所授知识的被动接受,而是学习者以自身已有知识和经验为基础的主动建构过程。本文以《圆明园的毁灭》的教学为
应中国科学院地学部学部委员、我所名誉所长陈国达教授和黄苏所长的邀请,在联合国开发计划署TOKTEN项目资助下,美国纽约市立大学地质系教授,英籍华人梁尚莹博士于今年6月14
SW—B 型地下水表综合参数记录仪,用于自动测量记录钻探过程中的钻压,泥浆进、出钻孔的流量,温度,比重等十项参数。其检测元件压力传感器和温度传感器等输出的信号有两种类
2006年11月18日至19日,江苏省周恩来研究会中青年学者研讨会在南京召开。会议的主题是:周恩来的和谐发展思想与实践。这次会议人数不多(只有20多人),时间不长(只有两个半天),
光阴似箭岁月如梭,时光在云雾中穿梭着,似乎发了疯一样飞驰着冲破那层厚厚的云雾,更像一名正在赛道上奔跑的运动员以最快的速度达到终点迈过胜利的白线。 Time flies like a
地质矿产部勘探技术情报网特殊矿种钻探技术情报交流会于七月十五日至十九日在青海西宁召开,出席会议的有来自各局队,科研单位,院校的专家、教授117人,技术情报资料61份。这是地
一九八五年度长春地质学院在培养人材的同时,承担了科学研究项目总计116项。截止10月末,已评审验收了20项科学研究项目,其中有许多项目得到评审委员会的一致好评,并达到国际
1985年第四季度全球共发生6级以上地震25次,少于前三个季度。最大震级为 M_S7.3级。第四季度的全球地震活动水平与第三季度相比有很大下降。1985年的深、浅震频数比为1.08,比
钢的不同硬度与无润滑磨损。无润滑磨损是某些机械工程零件经常遇到的一种磨损。如果在无润滑磨损中应用不同硬度的材料对磨,会得到明显不同的磨损率。为了选择最佳的材料配
本文测量了槲皮素的化学发光光谱,λ_(max)为520nm。研究了槲皮素的化学发光反应,反应过程的荧光,动力学特性及产物的纸色谱。首次提出了槲皮素-H_2O_2-KOH的一种可能的化学