一种基于维基百科的文本表示方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:cd21love
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本表示是自然语言处理中的基础任务,通常的文本表示模型都是基于训练数据充分的情况下进行。而在训练数据缺乏时,无法完成自然语言处理任务。提出了一种基于维基百科的文本表示方法,引入维基百科词条之间的关系,通过Page Rank传播模型,能够一定程度上解决训练数据缺乏时文本表示的问题。通过实验论证了基于维基百科的文本表示能够增强分类方法的准确率、召回率和F1-测度。
其他文献
<正> 中国古代小说的发展源远流长,小说观念也处于不断的发展之中.关于魏晋时期的小说观,自从鲁迅先生在《中国小说史略》中引明人胡应麟“变异之谈,盛于六朝,然多是传录舛讹
淤积性皮炎最多见于下肢静脉曲张的并发症,系由于下肢静脉曲张后下肢血液倒流,静脉血流变慢,静脉淤血,导致小腿及足部皮肤血液含氧量及营养成分减少而诱发,根据张培华等的调查结果
在相似区域较多的图像匹配时,SIFT(Scale Invariant Feature Transform)算法的匹配计算(KDtree-BBF)较复杂,耗时长,很难满足实时性要求。提出一种改进的匹配算法,将特征点的周围邻域的主方向梯度作为特征之一,采用主方向梯度和欧式距离相结合的计算方法进行特征点的匹配。实验结果表明:改进的算法不仅简单易行,且对图像的旋转、缩放、光照变换均具有良好的鲁棒性,比较原
<正> 《左传&#183;庄公十年》:“衣食所安,弗敢专也,必以分人”。选自《左传&#183;庄公十年》的“曹刿论战”一节,是脍炙人口的古文名篇。从《古文观止》到现行中学教材,历来
为了提高系统的处理效率,减少系统的测量误差,提出了一种基于动态计数型布鲁姆过滤器(Dynamic Counting Bloom Filter,DCBF)的流抽样测量算法。该算法使用基于报文级别的抽样,
【正】在"神舟五号"一举发射升空并按计划完成飞行任务顺利返回地面,我国首次载人航天成功不久,神州大地仍然沉浸在一派欢乐、喜庆的氛围中的时候.某报曾经刊出配