一种基于维基百科的文本表示方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：cd21love

【摘要】

：

文本表示是自然语言处理中的基础任务,通常的文本表示模型都是基于训练数据充分的情况下进行。而在训练数据缺乏时,无法完成自然语言处理任务。提出了一种基于维基百科的文本

【作者】

：

黄浩军王胜清

【机构】

：

北京大学软件与微电子学院,北京大学现代教育技术中心

【出处】

：

计算机工程与应用

【发表日期】

：

2015年14期

【关键词】

：

维基百科隐含狄利克雷分布文本表示文本分类 Wikipedia Latent Dirichlet Allocation（LDA） text repres

【基金项目】

：

文化部国家文化科技提升项目（No.201201-02）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本表示是自然语言处理中的基础任务,通常的文本表示模型都是基于训练数据充分的情况下进行。而在训练数据缺乏时,无法完成自然语言处理任务。提出了一种基于维基百科的文本表示方法,引入维基百科词条之间的关系,通过Page Rank传播模型,能够一定程度上解决训练数据缺乏时文本表示的问题。通过实验论证了基于维基百科的文本表示能够增强分类方法的准确率、召回率和F1-测度。

其他文献

针对突出问题商量改进措施——重报集团新闻管理工作委员会主任(扩大)会议剪影

期刊

新闻管理重庆日报当前新闻都市类媒体

魏晋小说观之再认识

<正> 中国古代小说的发展源远流长,小说观念也处于不断的发展之中.关于魏晋时期的小说观,自从鲁迅先生在《中国小说史略》中引明人胡应麟“变异之谈,盛于六朝,然多是传录舛讹

期刊

小说观魏晋时代中国古代小说幻设游心寓目《搜神记》三十六《西京杂记》街谈巷语拾遗记序

淤积性皮炎治疗的研究进展

淤积性皮炎最多见于下肢静脉曲张的并发症，系由于下肢静脉曲张后下肢血液倒流，静脉血流变慢，静脉淤血，导致小腿及足部皮肤血液含氧量及营养成分减少而诱发，根据张培华等的调查结果

期刊

淤积性皮炎中西医治疗进展

组织策划科普活动增强科技强国意识——中国载人航天重庆展集锦

期刊

科技强国中国载人航天组织策划向太空航天精神杨利伟热爱科学爱国主义教育航天英雄集团广

基于主方向梯度的SIFT算法匹配的优化

在相似区域较多的图像匹配时,SIFT(Scale Invariant Feature Transform)算法的匹配计算(KDtree-BBF)较复杂,耗时长,很难满足实时性要求。提出一种改进的匹配算法,将特征点的周围邻域的主方向梯度作为特征之一,采用主方向梯度和欧式距离相结合的计算方法进行特征点的匹配。实验结果表明:改进的算法不仅简单易行,且对图像的旋转、缩放、光照变换均具有良好的鲁棒性,比较原

期刊

图像匹配SIFT算子主方向梯度鲁棒性image matching Scale Invariant Feature Transform（SIFT） m

展示传媒形象真诚回报市民——我市新闻界与受众共庆记者节

期刊

记者节新闻工作者协会重庆广电集团重庆日报正确舆论导向中国新闻奖新闻采访宣传工作信报

记录发展历史提供宝贵借鉴——重庆日报报业集团年鉴第三届工作会议剪影

期刊

重庆日报报业集团工作会议编纂工作经验教训

“衣食所安”新解

<正> 《左传·庄公十年》:“衣食所安,弗敢专也,必以分人”。选自《左传·庄公十年》的“曹刿论战”一节,是脍炙人口的古文名篇。从《古文观止》到现行中学教材,历来

期刊