
中国大数据联盟理事会谭建荣院士在2017中国大数据应用大会发表题目为从大数据到工业大数据的演讲
信息技术最热门的词汇就是大数据,它的来龙去脉是怎么样的呢?大数据这个词刚刚传到中国也有人认为是美国人的炒作,过去是提海量数据,现在我们又提大数据,那么海量数据和大数据有一些什么区别呢?仔细体会大数据不是现在提出来的,大数据是很早提出来的,现在比较公认的是提出大数据的人叫阿耳文?托夫勒,他写了一本书,他把人类分三个阶段,第一个阶段是农业阶段,第二阶段是工业阶段,第三阶段是工业化阶段,他在《第三次浪潮》这本书上讲互联网是一个舞台,真正唱戏的主角是大数据,大数据将奏响第三次浪潮的华彩乐章。
2012年就率先提出了工业大数据的概念,在工业领域、信息化相关过程中产生的大量数据。工业大数据主要来自三个层次,第一是产品创新层面,第二个是制造技术方面的,第三个是产业模式方面的。以数字化、网络化、智能制造为主线形成工业大数据。那么工业大数据具体来说来自四个方面,第一数字化设计,产品的数字化设计,车间的数字化设计。第二来自智能化制造,第三来自网络化监测,第四来物联化管理。

工业大数据贯穿于产品的设计、制造、使用、维修、回收这五个方面,包括了数据获取、数据集成、数据应用。工业大数据和一般大数据比较有哪些特点或者需要特别注意哪些方面。第一个就是语义性,工业数据都有一些内涵,它是工程的语义。第二个是时效性,工业大数据是生产过程中整个动态的监测、控制,所以它有很大的时效性。第三个是它的异构性,它既有图片,又有数据,不同的数据还有不同的数据结构,所以它的异构性是比较明显。第四个它的多域性,既有力学、机械、电气等。
再看看工业大数据的发展趋势,过去是数据分析,现在要从数据分析进一步发展到深度挖掘。第二从数据处理发展到实时计算,过去我们也在数据方面、计算机处理方面做了大量工作,但是要做到实时的计算,这个叫做规模推送,以前处理的数据都是批量的比较多,现在需要个性追踪,就从结构数据发展到了异构信息。因此智能化,实时化,个性化,异构化是工业大数据的主要发展趋势。
工业大数据的价值我们知道是非常震撼的,在不同部门产生的数据优化带来的利益、效益那是非常的巨大,如果数据使用量提升1%,那带来的价值都是非常震撼,在航空部门可以带来300亿元价值估计,电力部门可以产生600多亿价值。在数据使用方面如果提升12%,那么对于人均产出提升幅度在零售、咨询服务、航空、食品加工方面都会产生巨大的影响。所以工业大数据产生的影响是非常的震撼。GE公司有20多类传感器,每个引擎产生飞行1小时将产生20TB的数据。这些数据有什么好处?美国月收集360万次飞行记录,监视机队25000个引擎,其开发的引擎大数据分析算法能够提前一个月预测其维护需求。
中国飞机晚点比较厉害,平时天气不好的时候经常晚点,但是在平时天气好的时候飞机也老是晚点。过去是说机械故障,现在机械故障说得少了,现在是什么原因呢?是流量控制。为什么现在机械故障少了?由于运用大数据分析,它的预审件的备件需要维护、保养时间可以精确的预测出来,在哪一个机场需要维修,这是最合理的。飞机是易耗品,既不能少也不能多,少了会影响飞机飞行,多了运行成本就高了,所以能够精确预测到什么时候需要备件,什么时候需要维护,什么时候需要保养。就像汽车一样。汽车规定是半年或者一年进行保养,其实它的冗余度是非常大的,但是现在没有办法去预测它到底什么时候开始保养,同时是最精确又是最安全的。现在通过大数据分析可以提前一个月预测到,其预测准确率达到70%。

我国有很多的房子,每个房子都有很多电梯,但是前一段时间出了一些事故,电梯还是一个比较危险的产品,大家坐电梯的时候一定要注意安全。电梯行业安全性也是电梯行业关注的。大概一年前在湖北一家超市里面走到最后一步板子开了,妈妈把孩子推上去了,妈妈就掉下去了,据说这个电梯是江苏一家公司出来的,后来大量的超市使用江苏这家公司的电梯全部退货。所以微软公司与德国蒂森克虏公司共同推出电梯检测监管大数据云系统,该系统和更加有效地监控位于全世界各地120恩万台电梯产品的大数据,提前作出安全预测和故障诊断。行业里面有一个规定,城市里面电梯坏了抢救员必须在2个小时以内赶到,因为顾客关在里面2个小时是极限,超过2个小时顾客就不不耐烦了。2个小时以后顾客会扒电梯门,通过预测他会知道电梯坏了,会马上派人来抢修,及时维修。第二个层面更重要,经过每天上上下下的分析,电梯的大数据主要连接两个部分,第一部分轿厢都装了摄像机,能够看到你,第二部分应用计算多了传感器,通过轿厢每天上上下下的状态分析,以及可以分析出电梯正常不正常,如果不正常它会出安全预测、预警,虽然这个电梯现在没有出事故,大家它的运转已经不正常了,它就会提醒你,这样就大大提高了电梯安全运行水平。
“工业4.0”就是西门子提出来的,西门子安贝格数字化工厂75%的生产过程是由机器自动完成,实现生产过程自动化数据采集与管理,通过对工业大数据进行智能分析,实现100次加工过程差错率仅有12次,大大提高了产品的质量和产品加工的一致性,以及控制了它的整个生产过程。
内容工业大数据及其应用关键技术
我一直在考虑,工业大数据和一起数据处理技术到底有什么不同。我也请教了很多大数据的专家,大数据和以前的数据处理有什么区别,关键技术在哪里,大到什么程度认为是大数据。什么叫大数据现在还没有比较统一的定义,但是比较权威、公认的定义是大数据是用常规的技术、常规的方法、常规的手段,难以处理的数据就叫大数据。当然也有人说这个定义好像等于没有说,难以处理,什么叫难以处理?常规技术,哪些是常规技术?哪些是常规方法?
大数据概念有点类似于数学上的无穷大概念。什么叫无穷大?是人类无能的表现,没有能力去刻画这个数字的大小,就叫做无穷大。但是后来有两个数学家从数学上把它量化了。哪两个数学家?一个是牛顿,一个是莱布里斯。无穷大问题转变为无穷小问题,无穷小问题就可以来分析,这个叫微积分,现在大数据还没有这么独特的分析方法。
那么哪些关键技术更适合大数据的应用呢?我总结了几条,在这里给大家分享一下。
第一条工业大数据的分类技术。就是看你怎么分类,因为我们面向工业产品,不同的行业就有不同的分类方法。比如说制造装备故障的大数据分类诊断,根据不同的装备出现故障的类型进行分类。比如说装备群体协同异常大数据的分类检测,根据对象不同进行分类。比如说变速系统行为大数据分类预测。
第二条工业大数据的建模技术。你这个数据别人要使用别人要有一个模型,计算机严格来说都是面向模型定义的,现在有一个MDB的叫法,没有模型计算机就没有办法处理。计算机第一条是它的数据结构,第二条是它的算法,算法首先就要有一个算法模型。
那么工业大数据的模型怎么样建立呢?我们首先要面对工业思维,对大数据构建形式化模型,针对不同系统进行形式化的建模。
异构设计大数据混合封装建模,计算机最擅长什么?就是黑箱模型,哪些东西应该放在黑箱里面?哪些东西应该放在黑箱外面,这就是封装建模的问题。
智能服务大数据多域递归建模,首先工业大数据要建智能服务的大数据递归建模,模型由粗到浅到精,就是LOD,就是分层次建模,分层次建模也非常有效。比如我在这个讲台上前面几个人我看得很清楚,但是后排的几个人只能看到一个轮廓,计算机也一样,后面一排的人没有必要把模型建起来,所以显示、计算的时候哪些作为基本单元,这就是递归建模的技术。
第三条工业大数据的聚类技术。有一个蚁情算法,这是什么东西?就是蚂蚁在爬的时候哪里有糖哪个地方蚂蚁就多,哪个地方蚂蚁多了就有蚂蚁喜欢吃的东西,按照这个原理有人提出了蚁情算法。
聚类算法我们可以进行流程的实施计算,满足聚类的分析,聚类的分析思想是很朴素的,古代中国人就概括出来了,叫做物以类聚,人以群分。其实数据也是这样,根据它的不同性质进行聚类分析。严格来说现在的高德、百度导航非常好,是智能化的多行系统,哪条路堵车厉害点,堵车厉害就全红的,流量稍微大一点的就是黄色线的,这个信息是哪里来的?就是通过手机信号分析来的,你聚类在这里位移速度非常慢那就堵车了。

在聚类算法当中还有不同的聚类方法,实时聚类,挖掘聚类,均衡聚类,算法也有很多。
第四条大数据的匹配技术。
第五条大数据的优化技术。
第六条大数据的可视技术。所有大数据要应用起来都必须做到可视化,比如说各种厂的可视化,所以我们概阔了六条技术。
在很多装备当中,包括超大型的空分,高档数控机床,大吨位深拉伸液压装备设计制造都运用了大数据,再次欢迎各位专家、各位企业家到我们浙江大学来进行技术交流、项目合作、人才培养培训等。


共有条评论 网友评论