——用“匠心”守护好工业数字化转型的源头
数据自动流动是工业4.0的精髓,数据自由有序的流动是智能工厂的前提与“燃料”。而我们物联网工程师的职责就是守护好数据流动的源头,我们一起来看看源头数据质量保障的重要性以及一些注意事项。
1、避免原则上的“应采尽采”
工业数据采集理论上应遵循“应采尽采”的原则,但前提是明确自身业务目标范围。工业现场的数据采集是生产制造执行系统(MES)最底层、最重要的一个环节,一般情况下,我们希望能够采集更多的与现场工业制造过程相关的数据,以便更好地为上层应用提供决策支持和潜在价值挖掘。但是,在做设备的数据采集之前,先问问自己为什么要采集这些数据,这些数据到底能够带来什么样的业务价值。大多数情况是,采集了很多数据,但是大家都不知道怎么用。诚然,国内大部分的工业现场还处在解决生产过程可见性的阶段,因此,能够先把数据采集上来是当务之急,至少能够实时地了解到现场都发生了什么。但是,在智能制造的大背景下,我们可以再看得远一些,在做数据采集之前,尽可能地多去思考一下什么样的数据对我们的业务改进帮助最大,这样也许会让我们在数据采集方面的性价比更高,多站在企业的角度去思考并避免“又贵又费”的采集方案。
2、结合数采目标,充分利用设备现有条件,采用最经济高效的的数采技术路线。
这里特别要提及的是一些数字化工厂改造中的一些老旧设备的数采,都是现下比较难解决的问题,比如:(1)老设备供应商不配合调试、不提供数据地址;(2)设备无法添加网口,部分旧设备没有对应的以太网扩展模块产品并且串口已经被触摸屏占用;(3)连接仪表未接入到PLC;(4)IP地址二次分配及其维护问题。当遇到这些问题时,大家要多查找资料,帮助企业帮到更经济、实用的解决方案。
3、工业数据采集根据不同行业、不同企业业务,其落地侧重点和部署策略均有所不同,不能盲目模仿;
国内工业领域范畴非常广泛,当前对于各个行业的生产自动化、流程自动化或者无人工厂来说,数据采集是刚需。但根据所处行业的不同,不同类型的企业对于数据的业务需求有所差异,所以对于数据采集工作的细分需求也会存在侧重点。
从制造业属性来看,通常流程类企业会更加注重采集的工作,离散类企业则更加关注协议解析。
石油化工、钢铁冶金、能源电力等流程类行业,特点是生产产线比较长、业务规模大,产生的数据量非常庞大。企业需要在各个生产环节,从众多设备和各类分布式控制系统中进行数据采集,利用大规模的数据来支持设备的故障排查诊断和智能决策,避免因故障停产。但同时相对来说,流程类场景下的数据协议相对单一,故需求更多集中在“数据收集”环节。
对于离散行业来说,企业的设备类型会比较繁杂,采集的方式会比较多,数据采集协议的丰富度很高,数据采集的工作中对协议解析的要求和挑战比较大。企业的业务诉求是需要分别解析适配这些协议,提供数据传输通道来获取不同设备中的数据,后续提升生产经营效率,因此做所以离散类对数据采集工作的需求更偏向“协议解析”环节。
4、落地部署过程中,非技术层面的问题相比技术层面问题,可能更加棘手。
在落地数采项目过程中,很多人都会更多强调技术层面的问题,而忽视非技术层面的问题,但事实上,数采工作基在都在现场,很大程度上需要考验数采现场工程师的施工前中阶段与工厂、现场的沟通协调能力。
以典型的工厂为例,有生产科、设备科、IT信息化部门、工艺部、安全环境部,不同部门在数据采集过程中的关注点不一样,所以潜在结果是对于数据的获取、最后价值的评估,大家提供的口径都是不一样的,会严重影响数据采集的效率。
根据调研结果,工业企业在落地部署中需要注重以下四个非技术层面的问题。
(1)管理层的支持。如果企业自身没有明确的数字化转型战略,或者主管的中高层领导在执行层面不看好,不提供明确的支持的话,无论是内部资源的投入、政策流程上的配合,都会遇到比较大的阻力,后续即使方案落地,效果也会大打折扣;
(2)协调网络施工。在准备网络施工之前,厂商需要事先与工厂就IP梳理、设备识别、设备清单获取等事项进行沟通,但其中的沟通成本比较高,原因是工厂或企业人员对现场实施过程、顺序以及流程并不了解,很多预备事项没有完成,后续便会牵扯到多方的协调沟通,甚至分责;
(3)协调停机停产。采集数据接入设备时需要临时停机停产,但这对工厂通常是不可接受的,所以事先与现场协调停机的难度非常大。工程师在现场实际接入一台设备通常需要1-2个小时,但加上沟通时间实际评估一天最多2-3台设备,严重影响施工效率;
(4)成本管控。对于企业而言,从业务角度来衡量计算数据采集的业务价值、产品服务成本尤为重要,所以在成本上需要进行管控,在成本、效率与质量之间进行取舍平衡。
5、“虚惊一场”的教训——专访第一代车间现场工程师
从本科到博士,夏分在浙江大学研究了10年数学,毕业后一度从事人工智能辅助医疗方面的研究,却因为缺乏结构化数据陷入瓶颈。刚好,有人推荐他去阿里云,抱着“医疗是民生,工业是战略”的想法,夏分于2017年7月加入阿里云,成为一名算法工程师,也是第一代车间程序员。
入职后的第4个月,夏分接手了第一个项目,用ET工业大脑帮一家风电企业提前预测风电机组故障。由于无法实时掌握工作状态,传统风电机组维护,通常都是在故障发生后亡羊补牢,维修费用高,维修周期长,还会影响生产的连续性。
一个5万千瓦的风电场,平均每年维护费用高达300万元,还会以平均3%的速率逐年递增。而这家风电企业拥有10个风电场、500多台风电机组,维护成本带来的压力可想而知。
就像一个人生病,病情发展有迹可循,如果能提早发现,提前干预,就能阻止病情恶化,节省医疗成本。而对风电机组来说,一个核心健康指标是温度,长期高速运转下,部件老化导致摩擦碰撞,就会产生不必要的热能,但有些时候,没有机械故障也会引起部件发热,怎么样才能在不放过故障的同时,做到不误报、减少风电场工程师工作量?
工程师爬上几十层楼高的风电机,为两台验证机组装上数十组温度传感器,在运转中源源不断地采集温度数据,夏分则在杭州的办公室里,实时监控并分析着数千里之外的数据。积累到上亿条温度数据后,夏分建立机器学习模型,希望能提前识别风电机组运行异常并预警。
一次,机器检测出的温度数值与模型预估的相差20多度,这让夏分有点不知所措,“温度过高将导致风电机组无法正常运作,这可不是个小问题。”远在新疆吐鲁番的工程师接到警报后,赶紧查看了“异常”风电机组测点的温度数据,却发现完全正常。那么,是网络传输不稳定?还是传感器故障或老化影响了数据的采集?夏分在脑海中推理着各种原因,不相信自己的算法会出错。
“怎么会只有1%的数据?”紧张排查几个小时,原因找到了,风电场出现严重的数据缺失,大量数据未同步上传,导致机器学习的并不是完整数据。
最终,ET工业大脑做到能提前2周识别风电机组潜在故障,大修变小修,单次重大事件维护成本降低20-40万元。夏分却意识到,要将前沿科技真正带入工厂,光靠在电脑前码出一套算法还不够,必须去实地考察真实情况。同时,通过这个案例,大家也可以看出,现场数采质量有多重要。
事实上,工业数据采集需求“千人千面”,作为新一代信息技术武装下的高技能人才,我们鼓励“择一事终一生”的执着专注,干一行专一行,用实干成就国家工业数字化转型的伟大理想。

