【摘 要】
:
在社会化网络和移动互联网的迅速发展下,用户生成内容成为网络一大数据类型,碎片的UGC内容中蕴含着丰富的用户解决任务和处理问题时的经验知识。本文探讨对碎片化的UGC进行知识组织,将知识组织过程具体分为UCG知识元抽取、UGC多粒度关联、UGC多粒度索引和实证过程。本文提出以知识元为基本的知识单元来进行UGC知识组织,以不同粒度UGC知识元关联结合形成多粒度的知识结构,从而面向不同的认知结构用户提供不
论文部分内容阅读
在社会化网络和移动互联网的迅速发展下,用户生成内容成为网络一大数据类型,碎片的UGC内容中蕴含着丰富的用户解决任务和处理问题时的经验知识。本文探讨对碎片化的UGC进行知识组织,将知识组织过程具体分为UCG知识元抽取、UGC多粒度关联、UGC多粒度索引和实证过程。本文提出以知识元为基本的知识单元来进行UGC知识组织,以不同粒度UGC知识元关联结合形成多粒度的知识结构,从而面向不同的认知结构用户提供不同层次和粒度的知识服务。本文第一章详细归纳总结了 UGC知识组织和知识元知识组织的研究背景,第二章分析了 UGC内容特征和知识组织需求以及多粒度在UGC知识组织中的作用机制,由此提出了面向碎片化UGC的多粒度知识组织模型,模型共分为三个模块,分别在本文的第三、四和五章展开详细叙述,其中第五章是以实证的方式验证本文所提出的知识组织模型的有效性。第三章提出了一种对碎片化UGC进行知识元抽取的方法,定义了适用于UGC的知识元描述模型。首先结合BTM主题模型和Glove词向量训练方法结合文本分割思想提出了知识要素抽取算法,接着运用改进kmeans算法对抽取出的知识要素进行聚类提取出知识元属性,最终生成知识元。第三章详细阐述了对UGC知识元进行多粒度关联的方法和流程,从等同关联和非等同关联两个角度来详细论述如何构建知识元间的多粒度关联,其中等同关联以概念匹配方法为主,非等同关联则借助多阶关联分析完成。第四章依据所提出的UGC知识组织模型建立多粒度索引,选取UGC数据,抽取UGC知识元,依据已有UGC知识元的多粒度关联,借助RDF描述框架构建UGC知识元索引和概念索引,结合概念索引-知识元索引建立UGC的多粒度索引。第五章在UGC知识组织的理论模型方法的基础之上以提供知识检索的方式具体实现知识服务功能。第六章对本文所进行的工作和研究进行了总结,提出了尚存不足之处并对未来深入研究进行了展望。
其他文献
民以食为天,食品饮料作为必须消费品的主要成分,一直以来以市场广阔、技术更新迭代慢、利润稳定等特点,在金融市场中颇受投资者的喜爱。我国金融市场虽然起步较晚,相比欧美等发达国家的金融市场还有较大差距,但随着我国改革开放和世界经济全球化发展,我国的金融业发展迅速。而且随着科技的发展,数据搜集变得越发容易了,我们可以轻易地提取股票市场的各种交易数据,这些数据具备大量、高频等特点,可以反映一个国家或地区的经
多模态学习是当下机器学习中特殊且重要的一类,旨在利用多种模态的数据信息采用机器学习方法进行信息挖掘和预测的学习方法。其常用的技术方向分为多模态表示学习,多模态翻译,多模态对齐,多模态融合,多模态协同学习等。其中,多模态融合是多模态学习的重要部分,通常在决策型任务中对模型的效果起着至关重要的作用,与多模态表示学习和多模态对齐有着不可分割的关系。多模态融合在过往的研究中通常依照融合时间分为早期融合、中
在基因组学的下一代测序技术研究过程中涉及到一个单变量与高维随机向量之间的独立性检验问题,为了更好地解决这个问题,我们从统计学的相关理论知识出发,提出一个统计量来对其进行检验。鉴于变量相关性在统计学研究中的重要意义,本文首先介绍了几种常用于独立性检验的相关系数,包括皮尔森积矩相关系数、斯皮尔曼秩相关系数和距离相关系数等。通过一系列模拟比较,说明距离相关系数在揭示两变量间非线性关系时有着独到的优越性。
<正>与发达国家相比,我国人口老龄化发展趋势具有较强的中国特色,为商业养老保险提供了巨大的发展空间,也带来新的问题和挑战。国家“十四五”规划将应对人口老龄化上升为国家战略,构建多层次、多支柱养老保险体系成为应对人口老龄化的重要举措。
如今,经济水平的发展伴随着环境污染的加剧,人们逐渐意识到空气污染对于人体健康的严重性。了解空气质量状况,可以帮助人们更好地制定出行计划,尽量避免在空气质量较差时出行。空气质量指数(AQI)能反映实时的空气情况,AQI越小,说明空气质量越好,越适于出行。在信息高度发达的今天,能准确地对AQI进行分析和预测,对我国的经济和环境有着十分重要的意义。珠江三角洲是我国重要的经济中心,是中国人口集聚最多、经济
随着课程改革的不断推进,教育工作者越来越重视课堂研究,其中“课堂观察”作为一种普遍而又有针对性的科学方法受到了中小学教师的欢迎。课堂观察作为改进教学的一种手段,不同于以往的听评课,它不是为了评价教学而存在,而是在整个观察过程听课者与被听课者之间是平等的,他们是为了探讨研究课堂学习,促进共同进步而产生的行为。教师可以利用课堂观察了解学生的课堂情况、分析自己的课堂教学,从而更好地设计自己的课堂,整理出
P2P是Peer-to-Peer Lending的英文简称,意思是个人对个人的信贷,即借款人和贷款人通过P2P借贷平台作为中间平台,完成贷款、利息等工作项目。依托互联网,它就可以完成包括注册、认证、记账、清算等工作的一整套流程。虽然P2P借贷平台发源于互联网,但它的本质仍然是民间借贷。它是以小额民间借贷为基础,依托于互联网平台完成信息之间的对接工作。在兼容不同类型客户各式各样的需要的同时,P2P借
自动驾驶是目前最前沿的研究领域之一,也是未来人工智能应用的重要场景。自动驾驶系统主要包含感知、决策和控制三个环节,其中决策环节在整个系统中起着承上启下的作用。同时,在实际行驶中,很多时候同一场景下不同司机的认知和反应(操作)并非一致,即同一场景可能存在多个合理结果,这就导致了自动驾驶中的所谓多模态问题,即Multi-Modal- Problem。多模态问题给决策带来难度,也影响决策效率,因此在决策
随着上世纪全球城市化进程的不断加快,与之匹配的城市管理模式愈发显得落后,导致城市化的过程中催生了诸多城市病,20世纪80年代初期,在WHO的主导下,加拿大多伦多市举办了一场学术会议,正式提出了“健康城市”理论,这种新型城市发展理念很快便掀起了一股风潮,开始在全球传播。通过研究国内外健康城市发展趋势,并结合国内外众多健康城市评价指标体系,在遵守健康城市评价指标构建原则的基础上,本文针对湖北省构建了相
夸克-胶子等离子体(QGP)作为高温高密下的退禁闭量子色动力学(QCD)相,其性质一直以来都是高能重离子碰撞领域的重要研究对象。重夸克偶素产额在QGP热介质中的压低可作为QGP产生信号的探针,因此重夸克偶素在热介质中的性质是一个重要的研究方向。在本文研究中,主要着眼于重夸克偶素的屏蔽质量随温度变化的行为。重夸克偶素的屏蔽质量可以从其空间两点关联函数进行提取,而空间两点关联函数可以通过淬火格点QCD