基于Web挖掘的教师知识地图生成技术及应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wjhjordanaaaaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着知识经济时代的到来,知识的重要性获得前所未有的显现和证明。专家作为社会知识的智力宝库,拥有着某一特定领域的专门技能、知识和经验,为社会经济和科研发展做出了巨大的贡献。然而,因为地理环境的特性,专家的相关信息是零碎局部的,现实中我们往往受人际网络的限制,不能找到真正的专家解决问题。这就迫切需要一个能够提供和查询专家信息的系统,把整个社会的专家信息收集起来,方便问题的解决、科学研究合作以及产学研的结合等。   本文主要研究基于web挖掘的教师知识地图的生成技术。随着互联网的发展,网络中存在了大量教师的信息,这为生成教师知识地图带来了新的契机。利用互联网上丰富的资料,整合应用不同的资料来源,将原本分散凌乱的教师信息,从众多网页中抽取出来,处理生成完整的教师知识地图,提供更完善的知识分享环境,方便使用者按图索骥,快速找到他们需要的知识。   通过对教师知识地图生成模型的研究,本文对教师知识地图的生成流程分为标引教师隐|生知识和教师知识关联两部分。其中标引教师隐性知识包括建立教师基本资料库、教师作品信息库和知识元库,教师知识关联包括建立教师与显性知识之间的关联以及教师社会网络和关联路径的生成。与传统网页爬虫不同,教师知识地图采用的聚焦爬虫并不追求大的覆盖,而是将目标定为抓取与教师信息内容相关的高校网页,通过分析教师网页特征,使用URL规则过滤无关网页,避免资源浪费和时间成本的增加。由于教师信息网页大多采用相同模板生成,本文采用基于XML的Web信息抽取技术抽取教师基本信息和作品信息。知识元库的构建则通过向量空间模型和TFIDF算法从教师的作品知识中提取知识元。知识关联部分利用建立好的知识元库组建基于Patficia Tree的汉语自动分词词典,对上传的显性知识进行知识元识别与抽取,提取权重最高的知识元来标记该显性知识,并搜寻具有相关研究方向知识元的教师以建立教师与显性知识之间的关联。教师社会网络则利用教师共同发表论文的合著者关系以及同一学校学院的同事关系建立教师可靠的社会网络并对教师关联路径的生成算法进行了研究。论文的最后对系统实现框架,系统结构和流程以及教师知识地图的应用进行了简要描述。
其他文献
20世纪70年代后期Black-Scholes的期权定价模型出现后,复杂的数学模型、数值分析和大规模计算在金融中的应用越来越多。计算金融就是用计算机实现金融模型和系统的数学方法,其
学位
本文针对基于马尔可夫随机场模型(MRF)的图像分割技术进行研究,通过深入分析马尔可夫随机场模型用于图像分割时的优缺点,提出了改进方案,将其用于单帧图像的无监督分割和动态场
随着网络的普及,各地各类学校对数字化校园的建设有增无减。此前数字化校园一直处于现建现用的初级阶段。由于网络规模的扩大,信息量剧增、开放性日益增强,网络资源缺乏高效统一
随着现代科学技术的飞速发展、计算机的普及应用以及企业信息化进程的不断加快,办公自动化从上世纪50年代提出至今的半个世纪里,得到了空前的发展。目前,办公自动化技术越来越普
图论是目前发展迅速、应用广泛的一个数学分支。在许多学科领域中,如运筹学、信息论、控制论、量子化学以及计算机科学等,其研究对象都可以抽象为图论中相关的概念,因此图论研究
中国科学院通过多年的科学研究,积累了大量的科学数据资源。海量的科学数据分布在各种异构的存储资源上,使得用户对这些科学数据的访问变得非常复杂、低效。数据网格技术是解决
学位
随着GIS应用的社会层面的广度和深度的迅速扩大,出现了许多优秀的GIS软件,它们各具特色,在数据格式、数据处理、数据显示等方面都有独到之处,被不同的单位、部门应用,因此造成了现
大口径光学元件的加工和检测技术是当今国内外研究的难点和热点。在采用常规的测量方式时,随着口径的增大,在考虑成本的前提下提高测量精度是非常困难的。而采用小口径仪器去测
人脸建模与动画是计算机图形学、计算机视觉等领域中的研究热点,在三维游戏、影视制作、人机交互界面、远程呈现等方面有着重要的研究意义和应用价值。本文围绕基于图像的真实
学位
Web服务是近年来提出的一种新的面向Web的分布应用开发与集成技术,它基于面向服务的体系结构,采用Internet通信协议和XML编码传输消息,代表了一种松散耦合的分布应用结构。然