在广泛的网络管理中,流量分类是必不可少的。最近,随着加密技术在互联网上的广泛采用,它变得越来越具有挑战性事实上的在HTTP/2和QUIC协议中。在使用深度学习(DL)的加密流量分类的当前状态下,我们确定了其典型处理方式的基本问题。例如,尽管使用了具有数百万个参数的复杂DL模型,但这些模型基于TLS握手的某些报头字段实现了相对简单的逻辑,从而限制了加密协议未来版本的模型鲁棒性。此外,加密的流量通常被视为DL的任何其他原始输入,而关键的特定于领域的考虑通常被忽略。本文设计了一种新的用于加密Web协议的特征工程方法,并开发了一种基于堆叠长短期记忆层和卷积神经网络的神经网络体系结构。我们根据来自主要互联网服务提供商和移动网络运营商的真实网络流量数据集来评估我们的方法。我们以更少的原始流量和更少的参数实现了95%的服务分类准确率,比最先进的方法少了近50%的错误分类。我们证明了我们的DL模型适用于不同的分类目标和加密的Web协议。我们还在一个公共QUIC数据集上对我们的方法进行了评估,该数据集在标记方面具有更细的应用程序级粒度,总体精度达到99%。
流量分类是网络运营商开展广泛的网络运营和管理活动的基础。这包括容量规划、安全和入侵检测、服务质量(QoS)保证、性能监视、容量测量和资源供应,等等。例如,企业网络管理员或Internet服务提供商(ISP)可能希望为业务关键服务确定流量优先级,识别未知流量以进行异常检测,或执行工作负载描述以设计高效的资源管理方案,以满足不同应用程序的性能和资源需求。根据上下文的不同,大规模的错误分类可能会导致无法提供QoS保证、高昂的操作费用、安全漏洞,甚至导致服务中断。
客户端和服务器之间的加密通信现在已经成为规范。大多数著名的基于web的服务现在都是通过超文本安全传输协议(HTTPS)运行的。另一方面,为了提高终端用户的安全性和体验质量(QoE),出现了新的Web协议(例如HTTP/2和QUIC),它们克服了HTTP/1.1的各种限制。使用真实的移动通信,我们估计大约32%的HTTPS会话已经使用HTTP/2作为其底层协议。然而,HTTP/2特性,如负载加密、多路复用和并发、资源优先级和服务器推送,增加了流分类的复杂性。虽然大量文献利用机器学习(ML)的力量实现不同的流量分类目标(例如,服务和应用程序级、QoE预测、安全),但在其实际使用中存在各种必须解决的限制。
没有发现记录