当前位置:今日智造 > 智造快讯 > 热门直播 > 其他

大数据技术会怎样改变化学工业?(2)

2017/3/25 10:50:22 人评论 次浏览 来源:古滕伯格 分类:其他

在前一篇 “大数据技术会怎样改变化学工业?(1)” 主要介绍了 化工行业数据的来源和特点 、对技术可靠性要求、以及大数据在化工研发活动中的作用。

本篇(2)则继续阐述大数据能否在工程设计、生产运营 、供应链管理各环节中发挥作用?是否会发生革命性变化 ?

四、大数据和化工工程设计

4.1 概念设计

实验室开发完成后,工业化设计的第一步是概念设计,或者叫工艺包设计,包含系统结构优化、系统参数优化和单元设计优化。前两项是过程系统工程的内容,后一项是化工原理或者单元操作(unit operation)的内容。大数据技术和这三者都没啥关系,如果非要扯点关系,就是单元设计中用到的经验系数,例如精馏的塔板总效率,换热中的污垢阻力系数。

估算塔板总效率最常用的一张图就是下面的OConnell 关联图,OConnell收集了32个工业塔和5个实验塔的数据,绘制了关联图。后人在OConnell的基础上,又增加了一些数据。这张图体现了大数据的思维,为什么会这样关联?说不清因果关系。这张图最大的创新便是找到用液体粘度和挥发度的乘积作为横坐标。

试想,如果有更多的工业塔数据,这张图会更准确、更精细。问题来了,谁有能力去收集不同公司运行的工业塔数据?甚至一个公司内部都难以协调收集。

(原图源自:《产品与过程设计原理》)

理论上,如果有人能收集了上万个工业塔的设计数据和运行数据,若要设计一个新塔,当确定物料体系、分离要求和处理量后,无需任何化工知识,便可直接从之前收集到的塔的信息中学习、设计出所要求的塔来,无非就是根据相似性确定塔的结构和各个尺寸。还是老问题,什么组织能够收集这么多工业塔数据?哪家公司会公开自己设备这类技术机密的信息?

4.2 工程详细设计

这里谈工程设计,指工艺包已经完成后的详细设计。化工装置的工程设计,主要依据设计规范,即设计过程中使用的规则和方法全部已经确定,无需再从数据中提取其他的设计规则。设计规范是从大量设计项目和装置建成后运行效果中总结出来的经验,设计规范中有大量经验性公式和经验性系数,这些经验性的东西就是从项目实践中学习得到。问题依然是谁、从哪里收集反馈信息?设计过程本身无法产生反馈信息,只是使用知识;只有从设计好的产品,即化工装置的运行效果中得到信息。工程公司的工作范围一般会包含装置开车,在开车中出现的问题,负责工程设计的工程公司可以收集到信息,以便在将来的设计中改进。但是,装置开车后的运行信息,设计单位无法收集到,也不会主动去触碰,因为这是项目合同范围外的事情,除非装置发生重大安全事故,设计单位才会被追责,被审查当初的设计过程。总体来说,设计单位没有能力大范围收集设计效果的信息,只有依靠行业协会,但是甲方,这些生产单位会无私贡献自己的信息吗? 同概念设计中所需的信息一样,这些信息都属于商业机密,不会被公开。在大型化工集团内部,这个不是问题,设计单位和生产单位都属一个集团,可以自上而下收集信息,形成内部设计规范。

工程设计过程,急需要改善的是信息和设计平台。化工设计涉及工艺、设备、安全、管道、土建、安全等各个专业,设计过程各个环节环环相套,前端的一个参数变化,会引起连锁反应,后面各个专业做的设计都要紧随变化。然而,每个专业都有自己的设计软件和信息平台。专业之间的信息传递基本依靠Excel表格,即从前端专业的软件系统导出设计参数到Excel表格,将该表格发送给下游专业,下游专业再将Excel表格内容导入甚至手工输入到自己用的设计软件中。带来的问题,首先信息传递不够及时,下游专业只要没有收到新的更新要求,就会继续按照原先要求设计,浪费时间;第二这种手工导入导出极其容易出错。

这就需要用统一个数据平台,只要上游设计参数发生变化,下游专业立即收到报警提示。当然,要让一个软件做到包含各个专业的设计,那并不可能,没有一家软件公司有能力理解所有专业要求,但是所有专业软件使用同一个数据库是可以做到的。一旦这个数据库平台实现,设计效率提高一倍毫无疑问。

所以,不管在概念设计还是工程详细设计,理论上基于大数据方法的智能设计在方法上可行,但是商业和技术保密要求决定了无法收集到足够的设计和运行数据来训练这个设计模型,这条路走不通。工业设计,依靠的依然是融入机理或半机理模型的工业软件,以及经过多年实践检验的经验系数。其中的经验参数依赖于实际运行数据的收集,但这里要求的数据量和数据处理方法都只需常规数据处理方法,远谈不上大数据。

五、大数据和化工生产操作

一旦化工装置建成并成功开车后,装置便交给运营团队运行。所有设计资料便是这个化工装置的产品说明书,运维团队必须按照设计要求操作运行装置。然而,一个装置的边界条件并非按照设计要求固定不变,例如原料纯度、公用工程温度压力;另外,运行时还有一些随机的瞬时干扰。所以,一个化工装置安装极多的传感器和控制器来对抗这些干扰以及非设计边界条件,从而使化工装置能够安全、稳定、长期地运行。

常规地看,各种传感器数据的作用有:

1.监测:判断设备和工艺运行是否偏离正常值

2.控制:计算工艺参数实际值与设定值的偏差,将结果送至控制器

3.模型参数估计和离线或在线优化:利用现场测量数据估算工艺模型参数,例如催化剂活性、塔板效率、换热器污垢系数,再使用校正后的模型作离线或在线优化

以上三点应用都是基于设计时工程师已经了解了装置的内在特性和机理,已经知道装置的稳态和动态特性,已经知道装置的数学模型,即关于这个装置的运行机理和知识都是透明的。如果机理都知道了,还需要大数据学习什么呢?学习出来的知识肯定都是已经知道的了,再学习便是毫无意义。化学工程作为一门超过100年历史的学科,工业中使用的过程机理基本已经清楚,否则就不可能设计工业装置。所以,基于大数据的机器学习对化工装置的操作优化起的作用有限。

在我看来,下面三种情形中大数据方法可以在生产操作中发挥作用:

5.1 软测量Soft Sensor:

基于技术水平和成本限制,不是所有重要工艺参数都能用传感器直接测量,例如浓度、纯度、密度、粘度。如果它们是产品质量指标,它们必然要在实验室被离线分析,离线分析最大的问题就是控制的滞后性导致系统不稳定。基于单元或过程的数学模型,这些无法直接测量的变量和其他可测的变量可以用模型的数学方程联系在一起。用代数语言表达,一个系统由n个独立变量和m个独立方程组成,则该系统有(n-m)个自由度,即只要知道任意(n-m)个变量的值,剩下的变量都可以解方程计算出。用统计语言表达,剩余的任意一个变量(某个不可测变量)与选择出的(n-m)个自由变量(均为可测变量)存在相关性。

如果模型已知,直接解方程即可;如果模型未知,只要运行数据足够多足够宽,可以用一个多元方程直接用数据回归待测变量和(n-m)个可测变量之间的关系,这是一个典型的机器学习过程。实际上,由于模型不清楚,无法准确知道系统有几个独立方程,所以要选择多少个自由变量也不知道,实践中便尽量多选择几个可测变量。一旦选择的可测变量个数小于系统真实的自由度,构建的软测量模型肯定无效。

现在广泛应用的软测量模型,有精馏塔塔顶组成、能耗、聚合物的熔融指数。

5.2 机理不清、边界不定下的操作优化

若单元过程的机理不完全清楚,或者运行时存在开发设计时没有考虑到的边界条件,便可从运行数据中发现找到设计时未知的知识和规律。

例如反应复杂、副反应众多的反应过程,完全把机理研究清楚的时间和金钱成本太高,但实验室研究成果已经足以为建立工业装置提供设计基础。这种情况下,即使工业装置已经在运行,但这个反应过程并非完全透明,可以通过运行数据,发现在实验室阶段没有发现的反应规律,从而进一步优化反应条件,这个优化无法在设计阶段考虑到。

又出现了我之前一直反复提到化工过程数据的一个典型特点,由于过程被严格控制,所以数据虽多但分布窄,无法采用机器学习从这种信息量少的大数据中提取出规律或知识。想要找到规律或者优化这个反应过程,必须人为让过程偏离设定点或者改变设定点,并且是主动尝试不同的设定点。

这种主动改变操作点(设定点)来优化操作条件的方法,不就是六西格玛中的DMAIC和实验设计吗?和大数据机器学习没关系。但在下面两种情况下,过程产生的数据分布比较宽,大数据和机器学习可以在操作优化中起到作用:

1.边界条件不可控,例如天气条件、原料组成。这样的化工单元由凉水塔、空压机等,它们运行状态总是随着天气在变化,数据范围足够宽,信息足够多。炼油装置也是如此,不同产地的原油成分不同,装置的最优操作参数也不一样。GE和IBM对风电行业的风力电机运行维护采用大数据技术进行监测、建模、预测、优化和维护,风电行业就是典型的边界条件不可控,这是同样的原理。

2.产品牌号多,不同牌号采用不同的工艺参数,例如产品为不同分子量的聚合物,积累的运行数据信息也非常多。

5.3 多变量先进控制

当装置边界条件经常发生变化时,系统控制是个令人头疼的难题。设定的控制器参数往往是根据某种工况整定出来,一旦当边界条件发生变化时,基于化工过程非线性,原先的控制器性能就会下降。

若控制器能根据测量变量的时序数据,实时自学习不同操作点下系统的动态特性,从而控制器能自己整定参数,提高系统控制性能。这个过程是个真正包含自学习的智能系统。

综上所述,在生产操作中,过程机理明确时,采用机理模型来优化操作;机理不明时,采用6 Sigma方法来调优。大数据技术能发挥作用的地方,可能就是过程变量不可直接测量的软测量、边界条件不可控过程和多原料多产品过程的数据建模、以及边界条件多变过程的先进控制。

六、大数据和化工装置维护

化工企业设备维护主要三方面工作:

1.状态监测:通过数字化仪表监测设备运行状态,是否处于正常

2.预维护:对设备进行定期检查和维护,避免设备发生突发故障

3.故障诊断和维修:故障发生时,找到并消除故障发生的根本原因(root cause ),维修设备至正常状态

化工设备包含静设备和动设备。静设备故障率比较少,除了机械力导致的破裂外,一般都是由于结垢、腐蚀等导致设备功能效率下降,例如换热器传热下降,塔板板效降低,破坏性不强。动设备,例如泵、压缩机,故障率要高很多,设备部件在高速运动中更容易损坏。一旦损坏,若没有备用设备,必须停车维修,对生产破坏性极大。由于动设备的内部结构复杂,原理也比静设备复杂,在状态监测、预维护和故障诊断三个方面对化工企业的设备维护团队都充满挑战,尤其在故障诊断和维修时必须引入设备商技术专家。

大数据技术在设备维护方面所起的作用有很大空间,设备维护模式会发生革命性变化。

1. 状态监测:静设备性能监测相对简单,只需用实时运行在线模型,即可估算出关键性能参数,例如换热器污垢系数。动设备监测只能用到电流、附属工艺变量这样的参数,发生重大故障时这些信号必然发生急剧变化,但是预测的周期太短,以致无法提前采取预维护措施。要提高预测周期,第一是依靠新型传感器,例如实时声波信号,国外3DSignals公司已经使用专利算法对关键动设备的声波信号进行识别,及早发现设备故障;第二是采用多变量信息综合判断,采用多元统计建模。

2. 预维护:关键设备维护可以分成三个层次,第一个层次是最简单的,就是坏了就修;第二个层次是定期的检修维修;第三个层次状态监测以进行预测性的维修。显然,预测性维修可以提升设备可靠性也减少了非计划停车、降低运营成本。上面提到的状态监测技术是预测性维修的前提。

3. 设备故障诊断和维修:从监测数据时序性和模式找到故障类别和发现故障原因的起始点。故障诊断是典型的模式识别问题,需要大量故障数据来训练模型,而一般化工企业作为设备用户无法独立收集到足够多的故障数据,所以要在运营企业这端做到故障诊断并不现实。只能依靠设备厂商采用工业大数据云收集所有卖出设备的监测数据,这样就变成了设备商来负责设备的监测、优化、维护、诊断和维修。

这可能是今后大型动设备运维的商业模式吧,设备商只是长期出租设备给化工运营企业,每年收取固定的租赁费和服务费。设备商建立工业云,直接实时接收所卖设备上的传感器监测数据,设备商分析实时数据,优化设备运行和维护,即设备商从卖设备转变为卖服务。GE不早已经这么做了吗?GE制造的风力发电机、航空飞机发动机运行数据都上传到自己的Predix云平台。现在Predix已经作为GE一项工业云服务开放给其他设备制造商,提供数据获取、存储、分析、可视化、机器学习的完整服务。考虑到数据的安全性和保密性,很多设备制造商必然开发自己的工业云平台。总体来说,卖服务是大型设备制造商的商业模式的必然趋势,这点也是对化工企业设备运行维护方面的一个重大变革。

七、大数据和化工供应链管理

这个主题我并不熟悉,为了文章的结构,照顾到化工企业运营的各个方面,我还是加了这一节,主要观点只能来自文献和网络了,主要参考文献《工业大数据白皮书2017版》。但是我认为这个白皮书主要针对离散制造业,离散工业产品的单位都是台,即每个产品是独立可数的。离散产品,很容易贴个二维码或RFID电子标签,便可跟踪每一个产品的销售、使用。但是化工产品的单位是吨,是连续制造出来,无法区分各吨产品之间的差别。大部分化工产品都是液态,连续生产出来存储在储罐中,没法区分客户那里的产品是何时生产?当时生产是什么工艺条件。也有化工产品是批次生产,可以用批次号来跟踪各个批次产品生产状况、销售、物流、使用。

第一类大宗液态产品,客户也是大宗客户,客户数量少,对产品质量的要求也比较一致,所以这类产品在供应链管理上能优化的自由度相对较小,大数据和数学模型作用不大。

第二类的批次化工产品已经同离散制造产品有点相似,可以借鉴大数据在离散制造业供应链管理的应用经验。

《工业大数据白皮书》主要介绍了大数据在供应链管理中的两点应用:

“供应链配送体系优化,主要是通过RFID等产品电子标识技术、物联网技术以及移动互联网技术帮助工业企业获得完整的产品供应链的大数据。利用销售数据、产品的传感器数据和供应商数据库的数据,工业制造企业可以准确地分析和预测全球不同区域的需求,从而提高配送和仓储的效能。”

“用户需求快速响应。即利先进数据分析和预测工具,对实时需求预测与分析,增强商业运营及用户体验。”

同供应链相关的便是生产计划优化系统,生产计划系统对多产品、多牌号化工企业特别有效,尤其在炼油行业得到广泛应用,为石化企业在选购原油、加工方案、调合产品结构、制定生产计划和调度排序起到重要作用,为石化企业创造巨大利润。石化行业的生产计划和调度软件早已商业化,例如AspenTech 的PIMS (Process Industry Modeling System)。生产计划系统本质上是一个线性规划系统,线性模型中的很多系数需要从实际生产数据中回归得到,其实也用不到大数据技术。

未完待续,篇(3)为总结篇,为全系列画上句号。

(文章来源于网络,版权归作者所有)


免责声明:本文系网络转载,版权归原作者所有,如涉及版权,请联系我们删除,QQ:1138247081!

共有条评论 网友评论

验证码: 看不清楚?