论文部分内容阅读
在研究有监督机器学习算法中的BP神经网络算法和无监督的机器学习算法中的k-means聚类算法的基础上,提出一种半监督的BP神经网络聚类算法对P2P流量进行识别.该算法具有有监督和无监督的机器学习算法的优点,能快速地进行精确的流量识别,即取少量离线的流量样本进行标记与分类,然后利用分类结果为聚类中心对大量在线流量进行聚类识别.这样既提高了效率,又能保证结果的准确性.利用BP神经网络对所采集的少量流量数据中每个流按包大小标准差、变换频率、平均值、包数目和总字节数5个特征进行分类,得出分类结果的特征均值,对大量