
CNII网讯3月28日,在工业和信息化部的指导下,为期两天的“2017大数据产业峰会”在北京国际会议中心召开。本次会议由中国信息通信研究院和中国通信标准化协会共同主办,数据中心联盟大数据发展促进委员会承办,旨在宣贯和解读《大数据产业发展规划(2016-2020年)》,支撑大数据国家战略落地,展示大数据产业发展成果,探讨发展面临重大问题,推动产业交流与合作。

明略数据副总裁 黄代恒
本文内容整理自中国信息产业网
明略数据技术副总裁黄代恒在29日下午的工业大数据论坛上发表了题为《感知与洞察-工业大数据应用实践》的演讲。
以下为内容实录
尊敬的各位来宾大家下午好!我是明略技术中心的副总裁。今天各位领导讲到很多的应用,今天想跟大家深入探讨的两个方面应用,一个是感知,一个是洞察。什么是感知?感知是利用分布式存储、计算计算将海量的传感器收集到的数据实时汇总,实现状态监控、感知隐患、避免风险。在感知过程中隐含了预测。
感知毕竟是已经对客观事件持续发生事情的已知,洞察不一样,已知的事件只能观察到A、B、C、D等15个维度,这15个维度后面可能的原因是什么?
在整个过程中,大数据在故障分析方面,能够在高速和自动实现更大价值。

这个事一直在提,关于大数据能不能在工业领域上用,用在哪些行业上,为什么是这些行业?一来就发现很多能源很多高端制造,很多轨交领域,为什么是他们?这并不是偶然的。我们的能源、高端制造、冶金、建设本身是国家的核心栋梁,它的传感层、传输层渐渐具备起来,如果把物联网整个看实际上是三层,最低端是传感层。

下面我从感知和洞察两个方向介绍一两个非常实际的例子。首先来讲怎么感受到,其实就在此时此刻有数千辆列车奔驰在大国高速铁路上,每个传感器是数以万计的。在大数据环境下,支持多源异构和协议解析是一个核心技术问题,特别是海量设备实时产生和回传的传感器二进制数据。解决方案的几个核心要素是:高并发、可配置、保证时序、支持多态应用。
再举一个例子,这也是在很多交通领域、能源领域遇到的典型问题。某个典型的牵引动力、轨道、交通领域场景,车载设备发生了故障,其实前后若干秒是有一个高频数据的。不管是强电牵引动力,还是汽车发动机还是变速箱、车轮的数据都是由顶层专家进行分析的。大家可以想象整个的周转系统一来慢,时效性不高,二来零散。专家也是人,原来专家标注这个样本时一天效率低的6-80个,最快的有200个。现在的技术演变到今天,可以帮助大家解决这个问题。
全国载运的大部分情况没有问题,只有一个点标成了红色,不是意味着整个车有问题,只是其中某个小环节有异常。真正做的是系统能够自动根据一些规则,发现问题。比如地铁遇到故障,大数据平台实时检测到,或者比如历史上出现这种事,立刻调记录,上次的检验结果对这辆车这个地方的检验结果有一处没有查,就立刻发过来。我们以设备为主体实现信息的聚合,很多信息聚合进来,比如说车辆运行的设备,比如说轨旁检测设备,包括点巡检设备都聚合在当中,通过这种聚合来实现。
刚才也有各位展示过很好的报表和销售状况,这些都是发生客观现实的直观展示。更多是这个事情为什么发生?可能的原因是什么?如何实现洞察,事实来讲有三个手段:
一、基于专家规则;
二、基于特征分析;
三、基于深度学习。
比如说什么叫专家规则,举一个中医的例子,老中医说的你这个人看你这个特色是体寒,他是根据一些身体特征判断出了一些症状,从而得出一些结论。这些结论其实背后是可以数据化的,如果把相关的数据量化,用数据关联表现出来,通过它的斜率和导数完全可以把专家判断逻辑转成机械,这是专家规则的机械化。
刚才我们在讲到异常的时候,其实这些异常有很多是跟数据有关系的。可能主要维度80-100个,但其中选出15个特征来,我们通过不断的做尝试,如果这条线比较平缓,说明某一个维度的特征和异常没有直接的关系。如果这个斜率非常抖,说明两者关系比较大。这个描述简单,因为数据量比较大,我们需要采取多个特征,把很多的特征放到一个平面上来进行降维分析,去发现问题。
包括刚才说的简单回归,还有一类是分类问题。用分类解决数据问题,有很多的方法,通常在实际应用中,我们利用多种方法组合使用。
最后一条路,这种模式的识别,是通过不断的小模式一层一层组合成大模式。也许这个东西预测量非常之大,取出来的数据可能不是这么多,但是当中有无数的迭代,一台GPS基本可以达到八台以上的普通计算机运算能力。比如说一个一台常态0.95%,比别的概率高了很多。
跟大家说感知和洞察是工业互联网特别是传感器互联网过程中非常重要的,到现在为止它还有很多的问题,比如说在感知中要实现高并发、无遗留、灵活配置,保证时序,还要实现整个系统多个系统汇聚起来,不同标本能够汇聚起来实现不同的场景。
洞察方面,手段结合、适宜为佳。数据科学家在现场,每个行业面临的情况不一样一定要有科学家在现场。最后一个是样本积累,循环迭代。这种样本积累要早做到,包括人脸识别最近的爆发,也是跟样本积累有很大的关系。
说了很多,首先第一条主线是传感器设备主线,生产系统、ERP、MES这两个数据最后可以做汇总分析。这个是非常完整的大数据,我们已经跟轨交某些部门合作,把所有的技术积累,在这个领域最佳的实践跟我们的客户一起在这个行业做一些贡献。
最后我想跟大家说一下,这也是在做大数据应用中比较重要的,有三种东西一个是数据,一个是技术,一个是业务。很多公司说数据最重要,没有数据什么都不重要。但是从我自己的经验来看,我觉得业务价值最重要。最终你数据做的有没有价值,要落到业务里面。没有业务场景,整个的调性非常低。

在大数据基础上,中国现在有自己很多的项目,我们也有了国际大型公司一样的接入能力、转换能力和数据处理能力,我也希望和大数据产业中踏踏实实在做时间的公司一起,随着优秀的制造企业的发展,随着中国传统企业的转型升级,明略数据希望与这次浪潮中,助力中国传统产业用更智能、更高效的科技手段成就为中国发展的中坚力量。
相关阅读
明略吴明辉:行业领军企业+AI科技企业将引爆行业人工智能发展
2017大数据产业峰会第二天 | 明略数据3场演讲*2个奖项*1个产业地图,精彩不停歇
明略数据董事长吴明辉:携智慧,与智能比肩,做中国大数据行业AI先行者
人民公安报 · 专版 | 专访明略数据联合创始人兼CTO冯是聪博士:依托大数据关联分析推进智慧警务新征程
明略金融 ? 深度 | “道”高一丈--详解明略大数据金融反欺诈技术创新
明略工业 | 明略工业大数据荣获2016年度工业大数据最佳解决方案奖
点击阅读原文,查看更多明略数据工业解决方案。


共有条评论 网友评论