基于机器学习的网络流量分类预测模型文献综述
摘 要:随着大数据时代的到来,网络技术的不断发展,导致了传统的基于端口的网络流量分类技术难以承受网络上信息量的大幅增长,因此,建立新型的网络流量分类系统是十分必要的。在这个大数据时代下,各行业对于数据分析的需求不断增加,在这种背景下,机器学习的优势尤为明显,机器学习可以很好地适应新数据的变化,通过特征选取,更高效地从大量的数据中找到数据的潜在的规律和价值。本文主要介绍了机器学习的多种分类预测算法,并讨论如何基于机器学习对网络流量进行分类预测。
关键词:机器学习;网络流量;分类预测
一、文献综述
大数据时代下,互联网的不断发展产生了各式各样的网络数据。对网络数据进行自动的分类和预测,是了解网络的整体运行状态、及时发现异常网络流量、有效控制异常网络流量传播的前提和基础,对于形成自动化、智能化的网络控制管理系统十分重要。然而,传统的网络流量分类技术已然不能满足当前的需求,建立起新型的网络流量分类技术将具有巨大的理论价值和应用价值,基于机器学习的网络流量分类便是当代网络环境管理中值得研究的一大课题。
(一)机器学习与分类问题
机器学习是一门集概率论、数理统计、算法复杂度等多种领域为一体的学科,其核心是计算机不需要建立具体的模型,仅仅依靠大量的数据来训练模型。机器学习的具体意思就是利用计算机对外部的海量数据进行收集获取,通过类似于人类的思维“学习”数据的规律特征,并对其进行归纳总结,提取出人类所需要的信息,又有强大的学习能力和广阔的发展前景[1]。
机器学习主要包括监督学习和无监督学习。在有监督学习中,输入的数据集将会被划分成为训练集和测试集,通过训练集数据训练出模型,然后利用此模型和测试集数据进行预测。杨剑锋等人在《机器学习分类问题及算法研究综述》中提到[2],当输出是连续型标签时,此问题被称为回归问题,当输出为离散型标签时,此问题则称为分类问题。无监督学习不存在标签这一概念,更强调的是分析数据内部的隐藏结构。
(二)网络流量及其分类概念
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。