基于概念集和粗集的中文Web文本挖掘特征提取的研究

来源 :福建电脑 | 被引量 : 0次 | 上传用户:yangzhehang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文引入HowNet本体论,作为中文Web文本特征向量集映射到概念集特征向量的背景知识,实现特征提取.同时将粗糙集理论应用于特征子集的选取,作为一种尝试。最后,通过实验,评测表明了两种技术较之毒统评估函数法在文本聚类和分类应用上的优势。
其他文献
本文着重介绍了脉冲式位置随动系统,并针对该系统设计上的难点,给出了一个低成本的解决方案。
本文以"互联网+"的战略思想设计新型的新媒体监管方案。该解决方案建立在云计算、大数据、虚拟化的基础上,利用资源在体系内统一资源管理,统一运作,共享体系内优质资源。使监管
近年来,随着猪品种改良,良种母猪增加,当地土种母猪减少,母猪产后尿闭症增多。笔者在20余年的临床实践中,采用中西结合治疗母猪产后尿闭62例,疗效显著。现予报道,供同道参考
口膜炎是牛羊常见的一种口腔疾病。原发性口膜炎多因采食尖锐异物刺伤口腔黏膜引起,或因家畜内热壅滞、上焦生火导致口舌生疮。继发性多因某种高热性疾病的内源性感染或因缺
中国医药学是一个很大的宝库,我站在20世纪70—80年代“开展一根针、一把草治畜病”的活动中成功试制出菌毒灵注射液。根据临床实验证明,本品是一种抗病毒抗菌的广谱抗生素,试治
本文简述了在网络安全管理中引入数据融合技术的原因,介绍了数据融合技术的特点和相关算法。随后根据两个典型的系统框架分析了数据融合技术在网络中的不同应用。最后指出了数
本文针对Internet的信息过滤问题,提出了一个基于PCCS聚类的信息过滤模型,给出了该模型的算法和实现该模型的关键技术,并对算法的性能进行了分析与评价.
AOP(Aspect Oriented Programming)是一种新的编程技术,它为开发者提供了一种描述横切关注点的机制,并能够自动将横切关注点编织到面向对象的软件系统中,从而实现了横切关注点的模
用寇氏(karber)法测定了川楝素腹腔注射对小鼠的半数致死量(LD50).取90只小鼠,雌雄各半,体重(25±2)g.以10%丙二醇生理盐水为溶媒,按序贯法测出川楝素腹腔注射小鼠100%致
本文通过介绍数码防伪技术及其特点,并详细论述了如何利用数码防伪技术进行产品防伪查询来构建企业查询系统,同时分析了数码防伪技术存在的问题,并给出解决方案。