多层次文档归类在挖掘及处理用户偏好中的应用

来源 :天津大学 | 被引量 : 0次 | 上传用户:c1074527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的迅猛发展,许多公司都企图借此以更贴近用户的服务提高各自的竞争力。用户到底偏好什么成了他们重点关注的问题。人们通过对web日志文件和相关数据的挖掘来发现用户偏好,并据此为用户提供个性化网页和有针对性的信息推送。目前,用于挖掘用户偏好的方法主要有分类和聚类。本文提出了不同于分类和聚类的另一种方法,即基于层级结构字典的多层次文档归类及其在用户偏好挖掘中的应用。它在一个层级结构字典的指导下,对文档进行特征值抽取,得到的特征值是多层次的,抽取结果被存为xml文档。这样,不仅可以充分利用已经取得的结果,而且在归类过程中,还可以选择一个最佳归类层次,以得到最满意的归类结果。该方法产生的归类结果仍然能够具有多层次的属性,因此基于该方法的用户偏好和用户群偏好的描述也可以是多层次的。用户偏好和用户群偏好同样被存为xml文档。基于层级结构字典的多层次文档归类能较为充分的利用已经取得的结果,并且能实现更精准的类别划分结果,能为个性化用户服务提供更加有效的决策支持信息。
其他文献
IPSec是新一代Internet的安全标准框架,它为Internet上IP报文的传输提供安全性保护。本文介绍了IPSec协议簇、IPSec体系结构组成、IPSec相关基本概念、IKE及其结构组成等;完成
随着信息媒体的数字化,大量视频出现在网络上,我们进入了“数字时代”。保护视频版权信息成为现在发展的重点,数字视频水印技术就是在这样的背景下发展起来的。视频水印技术
网络流量特征选择方法是决定分类器差异性设计的关键,能够提高分类结果的可理解性,发现高维数据隐藏的结构;高效的流量分类有助于网络态势分析与动态访问控制,是实现网络管理
网络的发展与普及,伴随着嵌入式与自动化技术的应用,促成家庭网络为越来越多的人们所关注。同时无线移动通讯技术的广泛应用使得人们对家庭网络提出更高的期盼。将家庭网络与移
计算机支持的协同工作(CSCW:ComputerSupportedCooperativeWork)是目前国际上研究和应用的一个热点。Internet和多媒体技术的迅猛发展和广泛普及,使得基于Internet在全球范围内
由于Intenet只能对所有的业务一视同仁地提供“尽力而为”的服务,无法保证视频会议系统图像和语音的传输质量,这就成为基于H.323的视频会议系统发展的一个很大的障碍。本文正是
VoD系统在娱乐和在线学习等方面扮演着重要的角色,并将得到越来越广泛的应用。目前VoD领域面临的主要问题是:如何以合理的成本给几千个潜在的用户提供可接受的交互点播服务。受
电子家庭医生系统是将互联网技术、电力线传输技术、自动控制、医疗处理技术和传感器技术融为一体的新型家庭健康监护系统。基于电力线传输技术的电子家庭医生系统,可以全方
脑脊液细胞数量少、种类多、形态各异,常用于中枢神经系统感染性疾病、脑血管疾病、脑膜白血病、肿瘤和其它免疫性疾病的鉴别与诊断。目前,国内外专门针对脑脊液细胞显微图像
基于集群技术的网络作业管理系统的目标在于将地理上分布、异构、自治的各种计算机和专用设备通过网络连接起来,建立有效的分布资源管理模式,形成一种高吞吐量和高性能的分布