基于生成式人工智能的工业互联网安全技术与应用研究

魔镜魔镜告诉我 · 发表于 1729160085

基于生成式人工智能的工业互联网安全技术与应用研究

董耀聪^1,2张倩^1,2 李宝强^1,2 李艺^1,2 董悦^1,2

（1.中国信息通信研究院安全研究所，北京 100191；

2. 工业互联网安全技术试验与测评工业和信息化部重点实验室，北京 100191）

作者简介

董耀聪：中国信息通信研究院安全研究所、工业互联网安全技术试验与测评工业和信息化部重点实验室工程师，主要从事工业互联网安全、人工智能、网络安全、数据安全等方面的研究工作。

张倩：中国信息通信研究院安全研究所、工业互联网安全技术试验与测评工业和信息化部重点实验室高级工程师，长期从事网络安全、数据安全、工业互联网安全等方面的研究工作。

李宝强：中国信息通信研究院安全研究所、工业互联网安全技术试验与测评工业和信息化部重点实验室工程师，主要从事工业互联网安全、人工智能、网络安全、数据安全等方面的研究工作。

李艺：中国信息通信研究院安全研究所、工业互联网安全技术试验与测评工业和信息化部重点实验室高级工程师，长期从事网络安全、数据安全、工业互联网安全等方面的研究工作。

董悦：中国信息通信研究院安全研究所、工业互联网安全技术试验与测评工业和信息化部重点实验室高级工程师，长期从事网络安全、数据安全、工业互联网安全等方面的研究工作。

摘要：近年来，人工智能技术飞跃式发展，工业互联网安全与大模型、生成式人工智能等新技术融合成为研究的重点方向和难题。针对工业互联网安全领域面临的突出性问题，对该领域人工智能应用现状进行了分析与研究，提出了一种适用于工业互联网安全的生成式人工智能应用的智能化分级标准；同时，对新技术、新概念、新领域的融合情况进行了总结与展望，旨在为后续工业互联网安全的研究起到指导和引领作用。

关键词：工业互联网安全；生成式人工智能；智能化分级标准；自动化渗透

引言

工业互联网安全有别于传统的网络安全和信息安全，其所面临的安全威胁既来自信息技术网络^[1-2]，也来自工业通信网络，可编程逻辑控制器、分散控制系统、数据采集与监视控制系统等工业控制设备及系统均会存在安全漏洞与威胁，利用这些漏洞及脆弱点则有可能会对工业生产环境造成致命性的打击。

世界各地均对涉及关键基础实施的行业（如能源、交通、水利、公共通信等）进行了大规模的安全评估与监管，并逐步加强了在工业安全领域的投入和研究^[3]。但随着云计算、5G、边缘计算等技术的发展，越来越多的工业控制设备与工业生产系统开始接入公共互联网以提供远程操控、数字化生产等服务，而越来越多的重要工业数据也不断汇聚在工业系统中。尽管可以使用虚拟专用网络、防火墙、堡垒机等技术或设备对通信链路与网络边界进行加固与保护，但不同工业场景下的安全威胁不尽相同，仅仅对链路层及网络层进行保护无法应对勒索软件、社会工程学攻击、高级可持续性攻击、零日漏洞等新型网络攻击。因此，如何依靠机器学习、大模型、生成式人工智能等新技术对工业互联网安全应用进行迭代与升级成为了重点研究方向之一^[4]。本文的研究将有助于推动生成式人工智能在网络安全、工业互联网安全领域的持续发展，进一步提高工业互联网的安全防护水平与能力。

1 研究思路

1.1 工业互联网安全亟需融合新技术

工业互联网安全是一个独特的技术领域，与一般计算机信息系统不同的是，工业互联网自下而上分别连接工业控制设备、工业控制系统、专有工控协议、通用网络设备、信息化生产系统、互联网设备等不同用途、不同层面的硬件与软件，任何一个组件都可能成为网络攻击的发起点或数据泄露的脆弱点。

传统网络安全注重网络结构，强调对网络边界的防护和设备自身的保护，工业互联网安全显然不只包含这两个防护要点，随着勒索攻击等新型网络攻击手段的迭代更新，新时代发展背景下信息化、智能化、数字化的发展浪潮也必将重构工业互联网安全的架构体系，工业数据势必将成为改变的核心要素。工业互联网拥有工业生产、安全日志、工控协议、网络流量、企业信息等多方位、多角度的海量安全相关数据，如何围绕这些数据并结合新技术将原有安全架构进行转变是当前环境下的重点研究方向。

人工智能、大模型等新技术的出现，可有效应对工业互联网领域数据清洗、分析的相关工作，同时面对不同类别、不同维度的数据（如企业运营信息、工业生产信息等），新技术也可通过大量的判断决策挖掘其内在的联系，从而进一步防止社会工程学攻击、内部人员攻击等传统安全技术手段难以应对的攻击形式。但现阶段业界并未在工业互联网安全的专项领域进行深层次的研究，新技术的融合程度也不高。

1.2 生成式人工智能可有效降低技术门槛

生成式人工智能是一种对输入的不确定数据及自然语言进行分析，而后利用特定的数据模型、规则做出与人类相似决策（或更优决策）并生成文本、图片、代码、指令等内容的计算机技术，也是人工智能技术的重要分支。

随着增强学习、深度学习、神经网络、自然语言处理、支持向量机等分支技术的提出与实践，人工智能技术在近十年迎来了爆发式发展，而广义网络安全技术的研究，也是通过对不确定的攻击数据或靶标信息进行分析，根据经验决策得出对应安全防护手段或渗透路径的过程，这与人工智能技术的内在逻辑几乎相同。此前，已有不少网络安全专家提出可通过人工智能技术加强漏洞挖掘、恶意代码检测、威胁流量分析等相关安全技术手段的及时性与准确性，但这些技术并未采用大模型，也并未形成清晰完整的“分析-决策”链，智能化程度不高。

随着聊天生成预训练转换器（ChatGPT）等大模型的发布，人工智能技术的发展迎来了新的高峰。大模型是一种机器学习模型，相比初期的小数据模型，其具备更大规模参数和更复杂的计算结构，相对也能处理更为复杂的不确定数据，生成更符合人类思维的决策结果。大模型在各行业领域均可起到作用，如语音识别及模拟、计算机视觉、艺术设计、医药研究等。在网络安全领域，大模型暂时还处在初级研究阶段，业界存在一批开源应用原型及商用智能化网络安全咨询机器人，但在工业互联网安全层面则几乎还未出现专为该领域设计的生成式人工智能应用及技术研究。如何通过人工智能技术对工业互联网面临的海量设备连接、海量数据汇聚等突出性安全隐患进行梳理、分析并最终实现自主防御是业界的主流研究思路。

2 应用现状与不足

本文按照功能侧重性对目前已经出现的工业互联网安全生成式人工智能应用与技术分为以下三类。

2.1 安全专家机器人

大模型应用离不开自然语言处理，ChatGPT等人工智能聊天机器人也是以高效的自然语言处理技术为基座，对输入的自然语言进行细致的分析处理，进而得到不同的回答。在网络安全行业，已有不少安全企业对安全大模型进行了研究，并提出了将安全专业书籍、安全技术原理、安全论文、安全事件、漏洞数据、恶意代码样本等众多安全数据为模型底座建立专用于安全领域的智能化机器人的技术路线。

相较于知识库类型的问答机器人，利用安全大模型构建的安全机器人在安全事件研判、威胁情报分析、恶意代码解读、漏洞信息筛选等以数据为基底的能力层面得到了大幅提升。

一直以来，企业面对网络安全事件时多以事先准备的安全应急预案作为应对手段，基于生成式人工智能技术的安全专家机器人可改善此类传统运营模式的效率，极大地提升企业面对安全威胁的实操与应对能力。同时，若将防火墙、漏洞扫描、入侵防御、入侵检测等相关安全设备与安全专家机器人进行接口关联和指令联动，也可达到更大范围的安全防御动作，真正意义上实现自动化安全防护。不过，该类型应用目前在工业互联网安全领域并未出现专用的分支，在已开源的安全大模型中也缺乏对工业安全知识的引入。

2.2 自动化渗透测试机器人

渗透测试是网络安全检测检验中的一项重要技术手段，检测人员利用漏洞扫描、网络嗅探、端口扫描、权限提升等方法，将自己“化身”为攻击入侵者，结合自身经验对目标系统进行渗透，从而达到挖掘目标系统风险点、安全漏洞等信息的目的，最后形成检测报告帮助目标系统进行安全加固与整改。

渗透测试有着明确的框架与步骤，一般包含信息收集、威胁建模分析、测试执行、路径优化及报告撰写等不同的流程，每一步骤均可对下一流程的决策产生影响，如何决策一般是测试人员根据自身经验及收集信息的内容来决定的。因此，使用人工智能技术对被测目标进行数据采集与分析进而就分析决策出最优渗透路径是目前业界自动化渗透机器人的主要技术框架（见图1）^[5-6]。目前，商用的自动化渗透机器人数量不多，开源领域则存在许多使用大模型接口进行自然语言处理并将之转换成相关指令调用第三方工具展开渗透测试的原型设计，这些开源应用中的生成式人工智能技术更多用于提升用户交互的友好度和自然语言处理的准确度^[7-8]。

图1 自动化渗透测试机器人常见技术框架

不过该类型应用仍旧缺乏对工业互联网安全、工业生产场景和工控安全的覆盖。在工业场景下的渗透测试，多针对工控设备漏洞、工控协议风险、组态软件漏洞等层面，因此渗透路径及所采用的第三方工具有所不同。

2.3 安全产品融合优化

漏洞挖掘、恶意代码检测、威胁情报分析、恶意行为检测等相关安全技术，均可采用生成式人工智能进行优化。例如恶意代码检测技术，传统方法通常基于已有的恶意代码样本库进行特征匹配，无法对新型或产生时间较短的恶意代码进行防范，而使用大模型与深度学习能够高效检测恶意代码片段并提高判断准确性，同时可对新产生的恶意代码进行甄别，大幅提升恶意代码检测效率。

大模型擅长的自然语言处理也可用于分析设备日志与报警信息，提取出有助于安全运营人员甄别的信息并进行自动化分类和总结，提高日志审计效率，减少运营成本。目前，工业互联网安全领域已有不少使用大模型加强工业安全威胁检测的案例，该类型技术在工业安全领域也可沿用与网络安全领域同样的技术路线和研究思路，用于加强工控漏洞挖掘、工业网络入侵检测等相关技术的效率与准确性，从而降低工业互联网的潜在安全风险，提升工业网络运行稳定性。

3 发展建议

3.1 工业安全模型分支

工业互联网领域存在不同的生产环境，有的注重工业控制设备的安全性，有的则重视网络边缘及内部网络的安全风险，且不同的工业生产场景所使用的设备、网络结构、网络协议都存在很大的差异，如果使用常见的安全专家机器人，只能对通用网络安全层面进行分析和决策，无法实现全范围的数据分析，也无法应对来自工控设备、工控协议等专业领域的安全威胁。因此，将海量工控安全知识、工控设备漏洞信息、工业协议数据、工业安全事件等数据及内容纳入到安全专家机器人的模型中，衍生发展出适用于工业安全的分支，训练出工业安全专家机器人，是未来发展的一个方向。

3.2 工业场景定制化

针对某些大型、复杂的工业场景，可以利用该场景的网络拓扑结构、资产信息、工控协议内容、网络数据包、设备日志等多维度、深层次的全量数据对该场景进行定制化的模型构建与数据训练，据此特化出的安全专家机器人可对该场景面临的网络安全、工业互联网安全及威胁进行更深度、更快速、更有效的分析与决策，从而辅助安全运营人员快速定位风险点，大幅减少生产停滞的风险。

同时，不同工业场景的网络结构与安全风险存在差异，因此渗透路径的选择及威胁模型的构建都需要借助渗透测试人员的丰富经验来决定。可将真实的渗透测试路径数据纳入自动化渗透机器人的训练数据集和验证数据集，并搭建环境进行再训练，对选取不同路径的行为设置不同的奖励分，引导机器人在工业场景中选择正确高效的渗透路径。

3.3 推动技术标准化

新产品的出现往往伴随着新的安全隐患，目前已有许多安全企业、科研机构、高校对生成式人工智能在工业互联网安全领域的发展投入了人员与资金，相信在不久的将来能看到更多高度智能化、自动化的工业安全应用与技术。为保障新型应用能够规范化、标准化发展，针对新领域的人工智能应用，有必要提前制定好智能化分级要求，一方面将有助于开发者按照不同级别的要求阶梯式完成不同层级产品或技术的研发，另一方面将有助于用户快速鉴别不同级别人工智能应用及技术可替代的工作范畴。

基于此，本文提出了一套适用于工业互联网安全领域的智能化分级标准。

4 智能化分级标准

基于汽车驾驶自动化分级国家标准的框架和工业互联网安全技术试验与测评工业和信息化部重点实验室多年来在该领域的积累，提出了一种在工业互联网安全领域对此类应用进行智能化与自动化程度分级的参考要求，为新领域的技术发展提供可参考的依据（见表1）。

表1 工业互联网安全生成式人工智能应用智能化分级

4.1 0级工业互联网安全智能化

分级要求：0级工业互联网安全智能化系统不能持续执行工业互联网安全行为与动作，具备持续分析部分工业互联网安全数据及以自然语言回答部分工业互联网安全问题的能力。

内容解读：工业互联网安全行为与动作包括但不限于防御、渗透、监测、响应等，0级工业互联网安全智能化系统使用的模型数据相对较少，其功能多以数据分析、自然语言安全问答等为主，可在工业互联网安全运营中为安全运维人员提供基础决策辅助。

4.2 1级工业互联网安全智能化

分级要求：1级工业互联网安全智能化系统在其设计的条件下可持续执行部分工业互联网安全行为与动作，具备持续分析工业互联网安全数据、研判及处置已知或普通安全威胁的能力，具备0级工业互联网智能化系统全部功能。

内容解读：1级工业互联网安全智能化系统能够在安全运维人员制定好的策略及框架下自动执行部分安全行为与动作，一般涉及网络边界管理和网络访问管理，可对工业互联网常见漏洞及场景进行简单分析与威胁信息的预研判，可为安全运维人员提供进阶决策辅助。

4.3 2级工业互联网安全智能化

分级要求：2级工业互联网安全智能化系统在其设计的条件下可持续执行部分工业互联网安全行为与动作，具备持续分析工业互联网安全数据、研判及处置未知及高级复杂安全威胁的能力，具备1级及以下智能化系统全部能力。

内容解读：2级工业互联网安全智能化系统能够在既定策略下自动执行大部分安全行为与动作，一般可涉及网络边界管理、网络访问管理、应急事件响应、威胁分析、安全告警、威胁处置等，可对工业互联网常见漏洞及场景进行深度分析，可对安全威胁直接进行研判和处置，可为安全运维人员提供高级决策辅助。

4.4 3级工业互联网安全智能化

分级要求：3级工业互联网安全智能化系统在其设计的条件下可持续执行全部工业互联网安全行为与动作，具备2级及以下智能化系统全部能力。

内容解读：3级工业互联网安全智能化系统能够在既定策略下自动执行全部安全行为与动作，若无策略限制则无法达到最小风险状态，可能出现错误操作，可由系统有条件地替代安全运维人员。

4.5 4级工业互联网安全智能化

分级要求：4级工业互联网安全智能化系统在其设计的条件下可持续执行全部工业互联网安全行为与动作并自动执行最小风险策略，具备3级及以下智能化系统全部功能。

内容解读：4级工业互联网安全智能化系统能够在既定策略与框架下自动执行全部安全行为与动作，无策略限制也可自动遵循最小风险策略，整个系统可达到最小风险状态，可由系统高度替代安全运维人员。

4.6 5级工业互联网安全智能化

分级要求：5级工业互联网安全智能化系统可在任意条件下持续执行全部工业互联网安全行为与动作并自动执行最小风险策略，且具备4级及以下智能化系统全部功能。

内容解读：5级工业互联网安全智能化系统能够自动执行全部安全行为与动作，无需策略限制，可由系统完全替代安全运维人员。

5 结束语

目前，生成式人工智能在网络安全领域的应用大多是以大语言模型作为技术底座，加入安全领域的相关数据与专业知识作为补充，在渗透与防御方向各自发展出了具备一定智能化程度的技术框架与设计，但在工业互联网行业并未出现相对应的专业领域安全大模型及应用。本文基于对现有安全领域大模型应用与技术的现状调研，将工业互联网安全领域近期可能出现的3种技术发展路线进行了详细的分析并提出了可行的优化方向，同时依据汽车驾驶自动化的分级标准框架，对工业互联网安全智能化系统进行了不同的分级，有利于未来该领域应用的规范化发展。未来，生成式人工智能与工业互联网安全的结合方向应重点面向不同行业进行细分与特化，针对制造业、能源、水务、电力、核能、航天、烟草等提出适用于该行业的智能化系统或安全大模型^[9-10]，采集不同行业的关键网络安全数据进行模型优化。同时，也应采用大模型对工业互联网安全检测、渗透测试、攻防演练、网络靶场等相关安全技术进行优化^[11-12]，进一步提升工业互联网整体安全防护水平。

本文刊于《信息通信技术与政策》2024年第8期