刘瀛工业互联网在安全生产中的实践与思考

刘瀛航天新长征大道科技有限公司副总经理

工业互联网在安全生产中起到了一定技术上的支撑。在安全生产中,既要拥抱新一代信息技术与生产管理模式相融合,又要强化和产品自主可控创新的能力,这样才能真正做到高效安全、本质安全。

以下内容节选自直播实录:

本文围绕三部分内容展开

1、背景与现状

2、工业互联网助力安全生产管控

3、工业互联网在安全生产中的展望与思考

背景与现状

大家都知道工业互联网在安全生产中起到了一定技术上的支撑,在安全生产管控中需要防范两种风险,一是内部风险,二是外部风险。

何为内部风险呢?安全生产中由于管理不当,违规操作,违规建设,执行不当等,导致在这个过程中会出现一些风险漏洞。利用高新技术,尤其是新一代信息技术来防范这些风险,能够更有效的管控安全生产中可能出现的风险。

除了内部风险之外,还有外部风险。外部风险相当于黑客入侵,在信息系统的管控中,经常会有一些黑客入侵,产生病毒,使信息系统发生瘫痪。而在工控领域,也会出现这种黑客入侵,以我们比较熟悉的伊朗“震网”事件为例来说,就是通过对工控系统入侵,使得工控系统出现大规模瘫痪,造成工控系统安全生产中出现很多风险,导致意外发生。

在内部和外部两种风险的情况下,是安全生产中面临的主要两个风险。

在安全生产中运用新一代信息系统技术来提高安全生产的管控能力,从相关的一些国家政策来看,很多都提到了加强信息化系统的建设。通过一张网(安监云);一张图;一张表;一盘棋,来推动安全生产的信息化管控。尤其今年推出全国安全生产专项治理三年行动计划中,强调了年之前建立企业的一张网信息化管控系统,推进重点行业和领域的机械化、信息化和智能化建设。

安全生产中内部风险现状如何呢?我们以一个大型的工业企业为例,它具有大量的复杂制造、大型实验、危险品加工存储等各种环节。以我们试点过的企业为例,大概在一级危险点有余例,二级危险点有余例,三级别有关0余例,分布在全国各地。以前也有相关的安全信息系统,但大多时候用不起来,或者用的不好,我们认为有以下不足。

第一,危险点未能具备24小时远程监管能力。大多数企业都有相关的安全管控信息系统,但是信息系统建设中数据不足。去年在调研中发现,我们国家专科以上高校,大概有20个有相关针对安全生产的信息系统平台,但是在这个信息平台中只有一到两家有相关的运行数据,而且这些数据残缺不全。大多数数据源头并不是基于设备数据,而是基于人的数据,人在监控这些数据的时候,很难保证实时推送,数据不全的时候,就缺乏了对24小时远程监控。

第二,各厂所自建平台,重复投资,缺乏标准。什么是标准?安全生产的标准与设备的数据模型标准是否一样,这是有较大区别的。对一个设备数据模型来说,它可能有电流、电压、加速器等一些相关数据模型。对于安全生产来说,这个数据模型是一个管理性的模型。对于一个做安全生产监控的人来说,他看到电压的时候,并没有直接反映出可能存在的安全漏洞,数据模型、安全模型没有匹配起来。在很多行业、很多厂所没有统一的标准模型,使得各厂所自建的时候就差别很大。

第三,上级安检人员难以精确的掌握下级单位的问题。例如集团安全管理的时候,可能受于人力限制大概只有2到3人,各厂所又有厂所级的二级单位二级安全管理人员,也在2到3人的规模,针对每个现场操作人员,每个设备都有执行人员。当一个集团想得到某一个具体设备安全监管情况的时候,是一级一级传达下去,而且传达的过程到收集的过程,大概需要一周的时间。为什么这么长呢?随着单位快速发展,有的不只是在一地,而在跨省多地。这种情况下,虽然信息传递以及有些数据是通过手抄形式,再返回来,再整理统计,再向上报,大概的时间就是一周。往往周一出现的问题,周五的报告里根本反映不出来。上级人员对下级单位的数据管理统计是一个麻烦。

第四,监管注重实时报警,缺乏问题分析和跟踪闭环。现场第一线人员大多数是执行人员,并没有较强的安全生产知识,往往出现报警的时候,他会第一时间处理,但是处理的时候只是解决了报警时的问题。举例,压力容器可能具备两种控制手段,一种是手动控制手段,另一种是自动化控制手段。往往刚建的时候,存在于自动化控制手段。自动化控制手段运行到一段时间,由于传感器问题和执行器的问题,会出现报警。而好多现场操作人员在出现报警之后,把自动化控制器停掉,用了手动控制模式代替,这样报警就没有了,但是隐藏依然存在。解决了实时报警的问题,但是没有跟踪闭环缺乏具体的分析问题,所以会埋藏一些深层次的设备隐患和管理隐患。

第五,安全知识和经验难以充分共享。在一个大型的生产企业里,有相关一些安全生产管理专家,比如特种设备方面,化学产品方面,危险品方面等,但专家数量有限。专家通过现场培训、授课的方式,把一些信息传到一线。由于集团人数众多,涉及到全国很多单位,通过线下授课的方式,可能一年轮一次。轮到的时候,学习人员又可能临时有事情,很难参加这个会议,所以专家的知识很难共享出来。现场出现问题,往往很难得到专家的支持。

再看看外部风险存在的形式和现状是如何的。

上图显示从年到年全球公共安全事件的一个走势图。这是针对制造业和国家基础设施遭受过重大攻击,重大后果的,可以看出来是逐年上升的趋势。

下图是工控漏洞的走势图,什么是工控漏洞呢?现在很多控制器在网络上,有些控制器有后门。年到年工控设备逐渐上云上网,漏洞的问题就体现出来,扫描的时候发现逐年增多。

针对外部风险,刚才讲的比较著名的就是伊朗的“震网”事件。它针对伊朗核电站的控制器有一个外部攻击,使得控制器自身的控制环路发生了较小的震荡。长期震荡导致了核电站某些执行机构出现故障,导致整个核电站的停机,造成巨大的危害。

下面以委内瑞拉停电事件跟大家进行阐述,这是一个典型外部攻击事件。从年到年先后出现三次大规模委内瑞拉全国范围停电。

年3月7日,委内瑞拉的首都加拉加斯出现了大规模停电,这是自年持续时间最长,影响范围最广的停电事件。超过一半地区,数日多次停电。此次电力系统的崩溃没有任何征兆,多数地区供电和通信网络受到了影响,使得前后有六天没有电用,这是迄今为止全球出现的最大规模的停电记录。

年年7月22日,委内瑞拉再次发生大规模停电,此次停电的主要原因是集中全国6成以上古里水电站的计算机中枢遭到网络攻击。

年5月5日,委内瑞拉一共有11个州发生了停电。

专家分析三次停电都是通过网络手段进行攻击。一是利用电力系统的漏洞,植入了恶意软件,直接对电力系统的一些控制器进行干扰;二是发动网络攻击,干扰控制系统引起了停电,这是针对典型的控制设备进行的干扰;三是干扰事后维修工作。为什么说委内瑞拉第一次停电有前后6天的停电时间?按照现在的维修来说,停电事件维修应该很快,一般城市电力系统故障,基本在一个小时内维修好。现在网络攻击不只是针对破坏性的攻击,同时在事后维护工作中,也进行攻击,破坏维修手段。

这是外部的攻击手段。随着我们对安全生产的认知增加,不只是内部在管理上、手段上和违规操作上要进行控制,同时也要防范外部可能发生的一些攻击。

在安全生产方面,有内部和外部两种风险。通过新一代信息技术手段,促进防范内部和外部的风险,得到更有效的安全运行效果,确保生产的稳定运行,降低安全生产事故,要做到以下八个转变。

一是危险点监控由在岗期间的现场监控转变为24小时在线监控。

二是安全报警事件由“逐级上报”转变为“移动端实时推送”。

三是安全监控由“异常报警”转为“事前预警、异常报警、事后分析、隐患识别”。

四是安全管理评价由“措施说话”转化为用“数据说话”。

五是事故应急处理由“现场处理”转变为“远程指挥+现场处理+应急联动”。

六是安全知识分享,由“定期授课”转为“平台共享+应用转化+专家激励”。

七是工作安全管控由“开放式裸奔”转变为“等级保护”。

八是公共产品由“引进为主”转化为“自主安全可控”。

工业互联网助力安全生产管控

现在谈一下工业互联网助力安全生产管控,如何通过工作互联网解决内部风险的一些手段和方法。

这张图是企业一张网,通过建立物联网和人联网,形成一个企业安全生产监管的综合管理平台。这张图的左边,是基于设备的摄像机和设备参数的,它是基于传感器形成的物联网数据。很多企业很早的时候就上了安全生产平台,因为数据上不来,往往通过人工手动填报数据,使得安全生产平台不好用。企业一张网,尤其针对安全生产监管平台,是基于设备数据、物联网数据,能够有效支撑安全生产监管。安全生产监管物联网的数据就是基于设备数据和设备图像数据,也就是现场数据。

图右边是基于人联网,针对不同岗位、不同级别的人所获取的数据不同,建立人联网的数据分级推送模型。现在信息系统爆炸,很多数据一遍一遍推送给一个人的时候,他往往受不了,没法分清哪个是重点,哪个是非重点。尤其我们讲现场操作者负责一个区域内十几个设备,一个单位有七八个区域的设备,一共50多个设备,对于集团来说就是上千个设备。如果把同等数据分给不同的人,对集团上层管理者来说就是很麻烦的一件事情,分不清数据的重要性。所以对于人联网,我们强调的是数据分级推动。

图中底部的是全生产社区,解决的是安全专家和知识共享的问题。

一个集团型企业可能只有十几个专家,专家的信息如何分享到一线操作者?以前的形式是通过现场授课,通过一个工业物联网的平台,专家一方面可以得到相关的设备数据,这样可以通过设备的数据实时判断这个设备是否存在一些异常情况;另一方面,专家的信息又可以通过平台分发给相关的管理者和执行者。所以这张网既含了左边的物联网数据,又含了右边的人联网数据,同时下方含了第三方专家信息数据。

以下具体来讲一下。

针对物联网的,就是设备分类监管。首先要把设备分级分类管理,为什么要分级分类管理呢?因为不同设备产生的数据模型要分配给不同的人。我们在设备分级分类管理答题分为三类。一是特种设备,二是生产实验设备,三是危险品生产和储存。

特种设备,需要有一些特种操作人员岗位执行它。往往这种特种人员岗位在很多集团里面是外协外包。电梯的维护是有专门的区域电梯维护人员,压力容器有专门的销售压力容器单位的专门维护人员,往往这个信息并不只局限于企业自己做安全生产监控的一个系统里面。所以这些信息一部分要给到企业内部的安全生产监管人员,同时那部分信息要给到特种设备维修维护人员,这两类数据的模型其实有差别。一是报警模型,一是实际设备数据里面的实际应用模型。

生产实验设备,往往是一些实验车、实验里面用的一些智能制造相关设备,稍后会详细讲解。这些模型又产生什么样的安全生产管理要素呢?

危险品、危险库,库房主要监管的是环境和库房里所做的危险产品。

除了设备模型之外,我们建的是人联网。人联网实现的是人的数据分级推送。我们针对一个安全生产监控来说有三类人员模型。

第一,首先是现场操作人员,是危险点安全第一责任人,主要是负责危险点现场监管和问题快速处理。往往这类人员是针对一个区域少量产品进行监管。一个屋里大概有30个设备,电的设备是归电的安全管理人员管理的,水的设备是由水的安全管理人员管理的,针对每个现场操作人员要求的是及时性和专业性,围绕它就产生了它相关的数据推送模型。

第二,除了现场管理人员,在一个厂所和一个法人企业来说,一定有相关厂所级的安全管理人员。安全管理人员管整个厂区,这个厂很大或者异地经营,对他的要求就很高。他主要做的事情就是危险品安全定期巡视、巡检,对危险点的隐患进行识别,对作业者安全进行评估,这是一个厂所的安全管理人员要获得的数据信息。

第三,集团级安全管理人员。他所管的面就更宽,对危险品所有安全负总体监管责任,对下级单位进行监督,看是否及时落实。同时出现危险的时候,出现重大危险的时候,参与整体的指挥调援。所以它更偏重于历史数据的分析和重大问题的远程指挥。

根据人员的模型,建立出分级分类的数据推送模型。我们在安全生产监控平台里,针对一线现场操作人员,一是现场操作人员主要碰到有可能出现的预警情况和及时出现的报警情况,如果未有处理的情况下,再把具体的信息推送给上一级。一般报警和危险报警的时候,通过报警所产生的后果,是否分发给厂所级或者集团级。

同时分级应急处理方面,主要是通过信息化和物联网平台解决现在应急处理的问题。

应急处理的时候:

第一,首先是现场处理。同时我们要考虑到一线员工现场处理的时候也会产生一些可能存在的危险,尤其是针对危化品。当出现报警的时候,现场人员可以通过现场视频观察现场情况,同时通过现场的一些设备参数,看可能会存在的风险。如果风险存在较大的情况下,端云结合的平台,应该有一些现场应急处理的预案存在远程监控的平台上。通过远程启动,下载一些应急预案,直接进入到控制系统。这个控制系统并不是一个直接的操作命令,而是一个远程预案。这个远程预案一定范围内可以调解应急情况。这样能够极大的减轻现场操作人员可能出现的风险。

第二,针对集团级的远程监控,一旦出现重大监控的时候,需要周边进行火警的联动、消防的联动,这方面要基于集团层面统筹规划。同时也要把相关数据快速推送给相关的火警部门,火警部门也根据这些数据的情况能够做好相关的预警预案。

根据集团级安全生产的平台,这个数据不只管到集团内部,同时要管向外分发,所以它是一个对外开放的数据平台。

刚才讲到的就是针对设备的分级分类管理和人员的分级分类管理。建一个平台主要有哪些功能呢?有以下五个功能:危险点的监控、多级预警、风险分析和评估、应急处理支持和专家知识分享。

数据的利用和分析是非常重要的,所有安全隐患往往很早之前就会产生一些可能存在的数据体现。而在这方面,我们现场一线管理人员往往不太具备这种分析的特点,同时我们说原来很多安全生产数据都是基于一个单体控制系统。比如说这个楼里有一个相关的地下室,地下室有一个控制系统,是一个计算机,这个楼相关危险点控制数据都在这个计算机理,其他安全管理人员很难得到相关的执行数据。这个数据能够上到平台上来,一方面相关各层级人员可以看到相关的历史数据、设备操作记录和外部安全事件所产生的一些直观数据;另一方面也可以给到刚才的专家平台进行分析。

现在基于物联网的设备,形成一个报告,可能就5分钟到10分钟,这样它的历史数据可以快速展现给不同的管理者,能够逐步通过对历史数据的分析发现一些隐患。

同时,针对安全生产管理人员,我们往往管理设备比较多。以往很难评价一个安全生产管理是否有效,这里通过设备的数据,可以形成一个安全指数的评价。安全指数评价大概分为五类,安全性、维修性、可靠性、操作合规性和防护性。

我们以可靠性为例,如何通过设备数据确定它的可靠性呢?当一个设备出现预警的时候,它就是带病工作,或者是轻级带病工作。10分钟之内解决这个预警打满分,如果10到20分钟不能解决,我们认为是80分,超过1个小时可能就是60分。同时,这是对可靠性进行基于设备数据的带病工作可直观的数据判断。

安全性方面,出现报警的时候,一次出现报警扣1分,出现超长时间报警不去解决的时候,就扣5分。这样使得我们在安全生产的时候,能够客观的量化出数据来,形成一个设备或者一个厂区或者一个单位的安全指数评价。这样可以基于同一个标准的情况下,可以看到这个数据直观体现出一个单位或者一个岗位对安全生产监管执行效率的问题,或者能够同行比较的问题。

近端网络攻击有两个方面,一是欺骗式攻击,二是网络阻塞式攻击。

近端数据攻击主要是针对传统数据库和操作系统的漏洞进行攻击。这方面更偏向于信息系统攻击。

近端设计攻击是针对一些控制系统设备进行攻击,控制系统设备主要是针对DCS、针对控制环路以及它的控制参数进行攻击。在一个环路的参数中,稍微调整一下并不会及时产生一些可能出现的风险,但是它会长期产生振荡。而振荡情况下,会使得控制系统执行机构长期产生疲劳,使得控制系统得到最后的损坏。这是相关三类攻击,近端攻击往往在工控领域产生影响最大的。

围绕攻击,我们讲如何防范。传统的防范包括等级保护,主要是主机防护。经过物理隔离和网络审计,这方面能够解决一些现在安全生产中可能存在的大部分问题。同时我们讲到在工业互联网上能够解决本质问题有两个,一是自主可控,二是可信计算。

自主可控当中,工业里有很多设备是国外设备,或者是第三方设备,存在后门。这个后门存在不能解决的漏洞。围绕国家开展的自主可控的工作,一共四个方面:一是核心芯片,二是设备,三是操作系统与开发环境,四是应用环境。它是一个统一的生态,缺少任何一方都很难完成自主可控的要求,未来我们在这方面,尤其是在工业安全领域要加强自主可控的应用。

通用计算和可信计算是并行计算。可信计算是在通用计算的同时,也在进行计算。它是基于密码的,含可信密码模块、可信平台控制模块、可信软件基和可信网络连接。可信密码模块是可信计算的基础,可信控制模块是可信根,可信软件是重要的逻辑部分,可信网络是将整个系统连接起来的可信系统。可信计算大多数占用大量的计算资源,在一些关键重要的环节,比如像核电,大型电网控制系统会增加这些核心计算,尤其是军用方面、基础设施方面,做一些可信计算,增加成本,增加了一些计算资源情况下保证了它的安全性。

工业互联网在安全生产中的展望与思考

第一,推动新一代信息技术与安全生产相结合是必由之路。通过建立平台,构建统一的标准。一个集团建立一个统一安全生产管理平台,尤其是针对设备的。目前来说,是针对某一类型设备,推行70%+的工程。针对不同单位或者不同企业相关的其他需求可以增加30%,而不能少于70%。

第二,分级建设,一个集团可能会有一级、二级、三级多类的危险源和危险点,所以要统一建设平台,分步实施,具体实施。

第三,重点先行,针对高危企业逐步重点先行。

第四,快速见效,很多区域要建立非密光纤,这样使得它建设成本和周期相对比较长。针对先行先试的产品可以先进行推进。

第五,充分研究以前的信息平台和设备,把相关的设备数据能够接上来,共享原来的成果。

同时,进一步推进工控安全技术的研究,主要有以下四个方面。

一是进一步加强安全信息在制造业的应用,包括可信计算、密码应用、5G和区块链相关技术与工业相结合,加快应用落地。

二是开展等级保护2.0,现在等级保护2.0能够基本解决目前来说工控系统裸奔相关的问题。

三是重点关键控制设备要国产化替代。根据“安可”和“信创”工程逐步开展,建立通用的货架产品和专用的货架产品,在关键环节开展国产化控制系统替线性失工作。

四是加强人员培训,随着信息系统建设和发展,以及和安全生产制造的变革,生产安全、信息安全对管理者的人员要求就越来越高,所以加强这方面的人员培养。

总结一下,安全生产是发展的基石。随着新一代信息技术和生产管理模式的融合,安全生产效率得到显著提升,逐步实现从事后处置到事先预防转变,从定期抽查到实时监控转变,避免低层次问题发生,降低生产过程中可能出现的事故。同时黑客对工控领域的入侵呈逐年上升的趋势,所以要未雨绸缪,做好工控系统保护,提升安全管控能力,是安全生产需要重点


转载请注明:http://www.chubans.com/tfss/8477.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了