什么是内联深度学习?

图 1:Palo Alto Networks Unit 42® 关于恶意软件传播/扩散速度和多态性的数据
新攻击的发起速度远远超过了传统沙箱、代理和独立签名技术的部署保护能力。在初次感染之后,现代恶意软件可在数秒内感染成千上万个系统,而这远远早于保护措施的开发和在整个组织的推广。要预防高级威胁,组织必须尽快防止从未见过的威胁造成初始感染。我们的目标是将可见性和预防之间的时间缩短为零。多亏了内嵌式深度学习,现在这一切都已成为可能。
什么是深度学习?
为了更好地理解内嵌式深度学习的概念,首先对深度学习和机器学习进行定义,然后再对两者进行区分,这对我们的理解很有帮助。深度学习是机器学习(ML)的一个子集,它利用人工神经网络模仿大脑的功能,从大量非结构化数据中学习。神经网络使用大量非结构化数据进行训练。它们可以实时收集、分析和解释来自多个数据源的信息,无需人工干预。在检查大量网络威胁数据以检测和避免网络攻击时,深度学习尤其有帮助。深度学习自动进行特征提取,消除了对 humansz 的依赖:例如在对狗、猫或鸟等动物进行分类时,深度学习将确定哪些特征(如耳朵、鼻子、眼睛等)是区分每种动物的关键。这些先进的能力使得深度学习在改进分析和自动化相关任务方面极为有益。/p>
什么是机器学习?
机器学习是人工智能的一种应用,包括解析数据、从数据集中学习并应用所学知识做出明智决策的算法。通常情况下,计算机会收到结构化数据,并将其作为训练数据,以提高评估和行动能力。虽然基于机器学习的基本模型旨在随着时间的推移提高其准确性,但它们仍然需要人工干预。
机器学习与深度学习
人工智能(AI)正越来越多地应用于各行各业,为自动化任务提供动力。人工智能的两大组成部分是机器学习和深度学习。这两个词经常被交替使用,但两者有明显的区别:
- 机器学习要求数据科学家或工程师手动选择特征或分类器,检查输出是否符合要求,如果认为生成的预测不准确,则调整算法。
深度学习无需人工干预。通过其神经网络将算法结构化成层,深度学习可以自行判断预测是否准确。
- 机器学习算法往往具有简单的架构,如线性回归或决策树。机器学习功能所需的处理能力也更低。它的设置和操作速度相当快,但效果可能有限。
深度学习要复杂得多。虽然它通常需要更强大的硬件、资源和设置时间,但它往往能立即产生效果,而且只需极少的维护(如果有的话)。
- 与深度学习模型相比,传统机器学习算法对数据的要求要低得多。ML 驱动的技术可以使用数千个数据点进行操作;深度学习通常要求数百万个数据点。所使用的数据在很大程度上也是非结构化的,可以包括图像和视频,使其能够消除波动并做出高质量的解释。
内联深度学习如何工作?
深度学习本身被广泛应用于包括网络安全在内的各行各业。由于它可以持续发展,并随着时间的推移从其摄取的大量威胁数据中学习,因此它已成为预测网络攻击的一项关键技术。为了进一步发挥其检测和预防新网络威胁的功效,一种更新的、业界领先的战术应运而生:内联深度学习。在发生安全事件时,在线深度学习可用于分析和检测进入网络的恶意流量,并实时阻止威胁。这一点至关重要,因为现代威胁参与者使用复杂的技术,使传统安全防御系统无法识别攻击。虽然内嵌式深度学习拥有这些令人难以置信的能力,但它的运行也不会影响个人使用设备的能力。它在后台运行时不会被察觉,不会对设备的工作流程或生产率造成任何干扰。
利用内联机器学习预防未知威胁
Palo Alto Networks 推出了全球首款由 ML 驱动的新一代防火墙 (NGFW),提供在线机器学习功能以阻止未知文件和基于网络的威胁。WildFire 和先进的 URL 过滤技术采用已获专利的无签名方法,可主动防止武器化文件、凭证钓鱼和恶意脚本,而不会影响业务效率。Palo Alto Networks 硬件和虚拟 NGFW 可应用新的基于 ML 的预防功能:
- WildFire 内嵌式 ML 能以行速检查文件,拦截恶意软件变种的可移植可执行文件以及 PowerShell 文件,这些文件在恶意内容中所占的比例过高。
- URL Filtering 内联式 ML 以行速检查未知 URL。该功能可在几毫秒内识别网络钓鱼页面和恶意 JavaScript,并在线阻止它们,因此网络中不会有人看到它们。
要了解有关 Inline 深度学习的更多信息,请阅读 Palo Alto Networks 白皮书:Requirements for Preventing Evasive Threats.
- 人工干预
机器学习需要数据科学家或工程师手动选择特征或分类器,检查输出是否符合要求,如果认为生成的预测不准确,则调整算法。
深度学习无需人工干预。通过其神经网络将算法结构化成层,深度学习可以自行判断预测是否准确。 - 架构和功耗
机器学习算法往往采用简单的架构,如线性回归或决策树。机器学习功能所需的处理能力也更低。它的设置和操作速度相当快,但效果可能有限。
深度学习要复杂得多。虽然它通常需要更强大的硬件、资源和设置时间,但它往往能立即产生效果,而且只需极少的维护(如果有的话)。 - 数据要求
传统机器学习算法对数据的要求远低于深度学习模型。ML 驱动的技术可以使用数千个数据点进行操作;深度学习通常要求数百万个数据点。所使用的数据在很大程度上也是非结构化的,可以包括图像和视频,使其能够消除波动并做出高质量的解释。