论文部分内容阅读
基于Enron邮件集合探索真实邮件网络,揭示出邮件网络的无标度特性和有限小世界特性。在此基础上,依据用户间交互强度设计山垃圾邮件协同过滤机制,通过调整参数λ,用户可以决定主要是依靠自己还足其他用户协同进行垃圾信息过滤。算法即使在没有对用户个人阅读习惯充分训练的情况下,也可以通过基于交互强度的网络协同方式实现良好过滤。同时为了解决Enron数据集缺乏标注的情况,基十训练样本集W和测试样本集T独立同分布的假设,利用改进的EM(Expectationmaximization)算法最小化WUT集合上风险函数,给出