工业互联网基础

周玉珍、张晓宇、匡亮、阮文飞

目录

  • 1 认识工业互联网
    • 1.1 回望工业革命发展历史
    • 1.2 读懂《中国智造2025》
    • 1.3 走进工业互联网
    • 1.4 发展工业互联网的价值
    • 1.5 【思政案例】时代使命
  • 2 智能制造基础
    • 2.1 传统制造业面临的困境与转型
    • 2.2 智能制造的本质
    • 2.3 工业互联网在智能制造业的应用场景
    • 2.4 【思政案例】探秘红旗汽车生产线
  • 3 工业物联网
    • 3.1 工业物联网概述
    • 3.2 感知技术之标识
    • 3.3 感知技术之传感
    • 3.4 感知技术之视觉
    • 3.5 感知技术之定位
    • 3.6 【思政案例】用“匠心”守护好工业数字化转型的源头
  • 4 工业网络
    • 4.1 工业网络概述
    • 4.2 工业互联网网络案例
    • 4.3 【思政案例】以“网络体系强基”为目标打造先进工业网络
    • 4.4 有线通信方式
    • 4.5 无线通信方式
  • 5 工业互联网安全
    • 5.1 工业互联网安全
    • 5.2 工业互联网安全案例
    • 5.3 【思政案例】守护工业互联网安全是全社会共同的责任
    • 5.4 工业控制系统安全
    • 5.5 工业网络安全
    • 5.6 工业数据安全
  • 6 工业互联网平台
    • 6.1 认识工业互联网平台
    • 6.2 工业互联网平台的产业生态
    • 6.3 工业互联网平台典型案例
    • 6.4 【思政案例】国产工业互联网平台的崛起
  • 7 工业软件
    • 7.1 案例背景
    • 7.2 工业软件实施方案
    • 7.3 工业APP的开发与应用
    • 7.4 【思政案例】工业APP是破解国内工匠不足难题的新思路
    • 7.5 智能工厂工业APP应用案例
  • 8 工业大数据
    • 8.1 大数据技术
    • 8.2 工业大数据
    • 8.3 【思政案例】工业大数据分析背后的科学思维方法
    • 8.4 工业大数据及典型应用场景
  • 9 工业云计算
    • 9.1 云计算技术
    • 9.2 工业云计算
    • 9.3 边缘云计算
    • 9.4 【思政案例】用中国式浪漫震惊世界
  • 10 工业人工智能
    • 10.1 工业人工智能技术
    • 10.2 【思政案例】机器道德——人工智能的伦理困境
    • 10.3 工业人工智能典型应用案例
  • 11 专业拓展模块
    • 11.1 物联网专业模块
    • 11.2 软件与大数据专业模块
    • 11.3 网络与安全专业模块
【思政案例】工业大数据分析背后的科学思维方法

——工业大数据分析背后的科学思维方法

如果想成为一名合格的大数据分析师,除了需要掌握必备的数学、统计学、数据分析工具等知识、技能外,还需要建立一套相对应的科学思维方法。我翻阅了一些数据分析师的招聘广告,几乎所有的招聘要求中,都会有这么一条,叫做“具备良好的的数据科学思维方法”。这一块内容是当下职业教育所欠缺的,由于篇幅关系,我这里介绍两种以抛砖引玉,希望能够激发大家对数据科学思维方法的兴趣,并使之转变为真正服务于国家工业现代化的理念和能力。

一、关联与因果

2008年,美国《连线》杂志主编克里斯·安德森(Chris Anderson)以《理论的终结》为题发表论文,认为“有了足够的数据,数字会自己说话”,进而认为能够得到事物或现象间的关系关系就足够了,关联关系可以取代因果关系,而科学甚至可以没有连贯一致的模型、统一的理论,或者实际上可以完全没有任何机制性解释而发展。而中国大数据领军人、大数据创新与实践一线专家、百万级畅销书《大数据时代》中文版译者周涛则在《为数据而生》一书中说,放弃对因果关系的追寻,就是人类的自我堕落,关联性分析是寻找因果关系的利器。

大部分关联性的背后,一般都会有因果关系存在。两个要素由因果产生关联的机制大概可以分成两类:1、两个要素具有因果的关系:比如刚做父亲的青年人常会买尿布;2、共同原因导致的两个结果之间的关系:比如孩子的父亲会常买啤酒,也常买尿布;于是,啤酒和尿布就可能关联起来。部分关联性看似没有因果,但背后往往有某些特殊的规律或因素其作用。比如,女孩子往往喜欢穿花色衣服,与基因和文化的共性有关。但这种因果关系可能相隔太远,以至于难以考证了。

另外,当人们需要根据关联关系作出决策时,需要研究因果的逻辑关系:到底是谁影响了谁。否则,根据分析结果的盲目行为可能适得其反。 “到底谁影响了谁”为什么会成为问题?大致有两类原因:1、忽视了时间因素。如“统计结果表明,练太极拳的身体差”。现实却是:很多人身体变差(包括衰老)以后,才练太极拳。一般来说,具有因果关系的两个要素之间,时间上有前后关系:原因早前,结果在后。2、忽视了前导因素。“公鸡一叫,天就亮了”。现实却是,天量之前的迹象被公鸡察觉到了。两者是第二种因果关系,只是看似“原因在后、结果在前”了。

事实上,相较于商务大数据分析更强调关系性,工业大数据分析则更重视因果,只有找到现象背后的真正原因,才能把分析结果通过解决存在的原因,将其反馈到真正的工业生产过程中,比如在工业常景中应用很广泛的设备故障诊断。

工业生产过程必须保证可量化、能推导和可验证,其本质就在于挖掘生产本质的各种因果关系。然而由于认识能力与水平的制约,目前人类在探求工业活动的过程中,大多停留在对关联关系的理解和处理层面,但是并不是说关联关系在工业大数据分析中没有意义,事实上,关联分析中挖掘出的有用的关联规则能够为因果分析提供初始的原因条件,因为关联分析能够发现大量数据集中项集之间的关联性或相关性,以及两个或多个变量的取值之间存在某种规律性。这样关联性的规则便是因果关系中的“数据源”。

先进大数据分析技术、工具的不断发展是挖掘因果关系的有效途径,基于工业大数据的分析,为从传统积累的大量历史数据中准确定位、判断、确认因果关系带来新的希望,也是未来可能实现工业机理突破的重要方向。

二、归纳与演绎

归纳与演绎是两种认识事物过程中的两个既互相对立,又互相依存的思维方法。归纳法是数据科学常用的的一种思维模式,是指从观察入手,先有数据,然后从里面总结共性,找到它的规律,得到模型,然后进一步来预测。而演绎法,是工业界常见的一种思维模式,它先有理论,然后再把理论衍生出各种各样的推论,再由这些推论去指导做出各种各样的机器、实验,最终反过来验证一个做法是否对,如果不对,再去检验前面这些理论、前提假设中是否存在不合适的地方,进一步来改进。

事实上,一门科学发现的过程,是归纳法和演绎法交融的。很多科学的新发现,新定律的提出,都是基于现实中发现一些新问题,然后通过数据归纳出来一些现象,再进一步提出假设,去验证理论。所以归纳法和演绎法的两种思维,都是科学方法论的一部分。比如互联网金融大数据,不涉及到机理,更多用的是归纳法来总结数据的规律。而在工业界,我们有很多成熟的物理学、化学定律来保证工业系统的正确性,所以可以广泛使用演绎法。但是工业大数据的价值恰恰是在两者的边界上,现在还存在很多物理、化学等机理解释不够完善的地方,我们要努力的方向是如何利用大数据技术从微妙的异常数据现象里去发现问题,怎么去结合工业机理去解答这些问题。

社会学、经济学和管理学与自然科学本质的区别在于研究事物的时候会容许更大的误差、更大的偏差,容忍更多的“未知”。广告和销售额的关系永远不会精确到分毫不差,而且永远不会有一个稳定的数学关系,一定存在其它未知因素的影响,但这不是我们不去研究广告和销售额关系的借口,而是我们不断研究其关系的动力。

工业大数据分析是解决不确定性的重要手段。不确定性是工业生产过程面临的主要矛盾之一,导致不确定性的因素有很多,人、机、料、法、环等所有的因素都有可能造成。以往的工业生产依赖经验,因此,随着工业大数据分析技术的快速发展,未来有希望从众多的线索中(成百上千的参数变量,在工业中普遍存在)发现规律,从长期的不确定性中实现确定目标。