基于上下文关系的文本分类特征描述方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:wfn031641lpp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本特征描述是文本分类的基础,其目标是用一定的可计算的特征来表示文本,在分类的时候用这些特征来区分文本。在向量空间模型(Vector Space Model,简记为VSM)中采用“词袋”法来处理文本,即文本被看成是由相互无关的词语构成的集合,不考虑词语之间的关系,但是这种处理方法不是很合理,因为文本的结构是完整的,孤立地对待单个词语将丢失文本的内容信息。在实际语言环境中,词语有一定的上下文“作用域”,“作用域”中的词语对表达同一主题具有一定的共性。本文提出了一种基于上下文关系的文本特征描述方法,包括特征选
其他文献
摘要目的:观察蒙药童格勒格-1(TGLG-1)四种粗提物对大鼠正常肝细胞BRL株增殖的影响。方法:制备出蒙药童格勒格-1的乙醇、正丁醇、乙酸乙酯、石油醚的提取物;体外培养大鼠正常肝细
近50年来,我国癌症的发病率逐年攀升,其中乳腺癌尤为突出。男性乳腺癌(MBC)本是少见病,不到所有乳腺癌的1%,但随着发病总人数的增加,临床上的病例也在增加。由于患者重视不够和临床医
目的:探讨成人慢性咳嗽的常见病因及其治疗方法。方法:通过询问病史、体格检查、胸部X线、肺功能、食道pH监测等检查,明确病因,对病因进行分类,并针对病因进行特异性治疗。结果:通
目的:运用Meta分析的方法定量评价以问题为基础的学习(PBL)与以讲座为基础的学习(LBL)两种教学模式在临床见习课程中应用效果。方法:检索中国生物医学文献、中文学术期刊全文、PubM
本文应用变色素 2R(Chromotrope 2R)显示神经髓鞘的新方法,将神经髓鞘染成红色,形态清晰,颜色鲜艳,操作简便,易于掌握,是显示神经髓鞘较为优良的方法,为神经组织的病理诊断和
本文用前房加压灌注视网膜缺血模型、β-NADPH脱氢酶组化方法研究了SD大鼠视网膜内含一氧化氮合酶(NOS)神经元的分布及其变化。实验动物依缺血时间分四组,分别为缺血10min、15min、30min及60min组。将NOS阳性细胞进
年来原位杂交技术的应用日益广泛,但出现的问题也不少。杂交信号的多少和强弱受到多重因素的影响,特别是蛋白酶K的作用。本实验比较观察了不同浓度蛋白酶K对肝癌组织切片杂交的影
用免疫组织化学方法研究了TGF-βⅡ型受体在实验性IgA肾病及正常小鼠肾内的表达。结果表明TGF-βⅡ型受体在实验性IgA肾病及正常小鼠肾内均有表达,但最明显的是IgA肾病的肾小管。该结果提示IgA肾病
5只性成熟成年雄性比格犬被施行附睾尾逆向注射10%精氨酸锌0.5毫升。一般饲料饲养两月后处死作病理检查,发现精子在睾丸曲细精管内的生成及在附睾管内的成熟均受到影响,附睾尾管腔内精
支持用户自由连贯地绘制草图是在线草图识别研究的目标之一。本文提出一种使用空间关系等上下文和贝叶斯分类器进行草图识别的方法,其主要特点包括两个方面:第一,使用笔画空间关系进行自动笔画成组,可以在不打扰用户绘图的情况下完成候选符号的选取;第二,利用贝叶斯分类器实现在线草图识别,可以解决识别方法的领域相关性及画法敏感性问题。实验验证了方法的有效性。