论文部分内容阅读
准确识别各种协议流量是网络规划、用户习惯分析、按业务流量计费等众多网络活动的基础。基于传输层特征参数统计的流量识别技术可识别出未知的协议流量,具有完整性好的优点,是当前流量识别领域的研究热点。但该技术往往需要正确标记出应用类型的样本流量数据进行训练或测试性能。本研究的主要目的就是研究基于深度包检测的流量识别技术,尽可能地识别并标记出P2P流量,从而为基于传输层特征参数统计的流量识别研究提供所需的P2P样本流量数据。为此,本文总结出了一种可有效分析P2P协议并提取出流量特征的方法;利用该方法对eDonkey、BitTorrent、DirectConnect、GnuTella、Skype、μTP、Ares、SoulSeek、PPS、PPTV、QQLive、迅雷等主流P2P协议进行了较全面的分析,提取出了存在的流量特征,以用于P2P流量识别;总结出了可基于DPI识别、部分可基于DPI识别、不可基于DPI识别等三类P2P协议流量,使读者对深度包检测可识别哪些P2P流量有较全面的认识;编写出基于DPI识别P2P流量的原型软件,以实现P2P流量的识别;最后抓取真实流量数据,从漏报率、误报率两方面测试了各P2P流量识别方法的有效性。实验结果显示,本研究总结出的流量识别方法误报率低,且可有效地识别出大部分P2P流量,说明标记后的流量数据可为基于传输层特征参数统计的流量识别技术研究提供样本数据;同时,还证明了本研究总结出的分析P2P协议并提取流量特征的方法可以有效地提取出P2P流量中的特征,并用于P2P流量识别。