论文部分内容阅读
为了给邮件网络分析提供预处理后规范、简约的数据集,提出了基于粗糙集的邮件系统相关定义。将邮件对象集按邮件收发时间属性分类,并描述了基于邮件属性值支持度的属性值约简方法。该方法成功运用在Enron公司邮件包中部分邮件数据的预处理上。实验表明,处理后的邮件分析数据更加规范化,并且极大地缩减了邮件对象集的大小。