Web挖掘过程和元数据的运用

来源 :情报杂志 | 被引量 : 0次 | 上传用户:epippo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当数据挖掘的对象完全由web这种数据类型组成时,这个过程就称为Web挖掘。面向Web挖掘必须以半结构化模型和半结构化数据模型抽取技术为前提。所以寻找和定义一个半结构化的数据模型是Web挖掘的关键,通过元数据来清晰地描述Web半结构化的数据结构,为Web挖掘提供基本条件。
其他文献
介绍了一种基于知识的文献检索方法。该方法从文献的类型层次扣文献的文件组织为出发点,建立了一种双重的文献模型。同时通过一个智能的面向用户的导航搜索工具来帮助用户规范
介绍了国内外本体学习研究的现状,并在给出的本体形式化定义基础上,界定了本体学习的主要任务;探讨了通用本体学习系统体系结构设计的基本原则,提出了适于中文环境下基于Web
从信息技术专业孵化器和孵化技术出发,系统分析专业孵化器信息技术滚动孵化风险因素,构建专业孵化器信息技术孵化风险指标体系,运用灰色系统评价方法建立信息技术孵化风险评
将知识个体提供的共享知识分为竞争性知识和非竞争性知识,区分了知识共享的主客观障碍,认为知识个体的非竞争性知识共享主要矛盾是客观障碍。通过分析知识共享中的社会资本问题
以具体实例分析了数据长期保存未能妥善解决前,馆藏发展出现的一种悖论及可能造成的各类影响,分析了影响数据长期保存的各种因素,并针对此介绍了目前国内外对数据长期保存,相
国际通信法是现代国际法专业化发展的产物,其界域包括两类通信领域的国际事务:一是国际通信活动的规制,二是通信制度的国际协调;其主体具有鲜明的多元化特征,被国际通信法赋
目的探讨90例肝胆管结石患者的手术情况。方法采用回顾性分析的方法,分析收治的90例肝胆管结石患者的临床资料,依据治疗方式不同分为两组。结果治疗B组手术时间、出血量均明
目的分析慢性硬膜下血肿患者行CT及MRI检测确诊血肿并进行相关探讨。方法所有研究患者共46例,28例患者采用了CT扫描,18例患者行MRI检测。检测后结果分析,统计学软件分析。结
给出了一种个性化主动信息过滤系统的设计与实现方案.该系统采用智能Agent来获取用户的需求模板,通过与用户的交互得到的反馈信息来更新模板,并最终实现主动信息推送.