Web数据挖掘中的可信数据来源

来源 :计算机科学 | 被引量 : 0次 | 上传用户:rangdeqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从大量Web信息中获取有用的信息是web数据挖掘的关键问题。如何评价web信息是否可信,现在主要方法是通过BadRank算法进行内容评测,或是通过链接权重进行相关引用数计算。可信数据来源是数据挖掘的前提,在基于关键词的数据挖掘中,通过评价挖掘所涉及的不同数据域,以及数据域自身的可信性,对在不同域所获得的挖掘数据给以权重,从而对挖掘结果的序列产生影响,提高挖掘算法在获取可信结果方面的效率。并通过试验测试了可信域评价的效果。
其他文献
提出了一种基于窄带M-S模型的图像交互式分割方法,解决了简化M-S的C-V方法针对图像全局,迭代速度慢和不能直接利用窄带法的问题;通过交互标记点和样条插值在目标附近建立初始曲线,以此曲线作为零水平集曲线,建立窄带,克服了窄带法局部求解的不足;实验表明,该方法大大提高了分割速度和精度,将此方法用于猪序列切片图像的分割,取得了较好的效果。
Web Services为空间信息处理功能的互操作提供了一种通过网络访问的解决方案,但Web Services标准中缺少对空间信息元数据的定义。致力于GIS资源共享和处理互操作的Open Geospatial Consortium(OGC)组织,针对该问题制定了Web Processing Services(WPS)标准。基于WPS 3种主要方法提出了一种可扩展的WPS实现体系结构,用于解决空间信
Web服务(WS)和SOA(面向服务的架构)正被广泛使用,其最重要的应用之一是用于连接各业务系统以实现企业业务流程自动化。对现有的Web服务的定义及使用的扩展做了一些探讨,将面向对象
针对LEO/MEO卫星网络的特点,提出了快速、自重构且支持多径的空间信息网络路由协议,并进行了仿真和性能分析。该协议不仅大大降低了端到端路由建立的时间,同时多径路由也为实现网
起源于群体智能的微粒群优化技术已经得到广泛的应用。一般情况下,我们假定微粒处于均匀分布的线性空间内。流形是几何学中的概念,概括地说,它是一个非线性空间。提出了一种基于
多宿主是克服路径失效,提高站点服务可靠性的有效途径之一。然而囿于当前TCP/IP体系结构的限制,多宿主还没有得到很好的普及。其中一个重要原因就是IP地址语义过载,IP地址既代表
一般来说,外存访问的数据文件中针对多属性的区域查询有两个改进其效率的方向。一个是在其上建立索引,另一个是在物理层按照某种规律重新安排记录。探讨如何通过第二种方法来提
由于多角度多度量的统计方法存在种种问题,提出了通过分形维数从整体上刻画互联网拓扑性质。以传统分形理论为基础,结合互联网拓扑所具有的自相似性质,给出网络拓扑维数的相关概
在现有的UML到Petri网模型转化规则的基础上,引入本体将其作为各种模型到Petri网模型之间转化的桥梁,研究各种模型到Petri网的通用转化方法。为每个模型包括Petri网模型建立本