大数据技术不仅能够对海量、多元且异构的数据进行有效的组合与分析,而且更重要的是其可以通过对历史数据及实时产生的数据的快速分析与推演,为企业的生产与服务提供前瞻的、强有力的决策支持。通过用数据来规划生产架构和流程,不仅能够帮助企业发掘传统数据中无法得知的价值组合方式,而且能给对组合产生的细节问题,提供相关性的、一对一的解决方案,为企业开展生产提供保障,进而提升企业整体的管理与决策水平。
一、大数据分析常用工具
目前常见的数据分析工具有SPSS、RapidMiner、Knime、Kettle,将它们进行简要的对比如下图所示:
二、核电施工管理系统
核电多项目管理信息系统是核电建造业务标准化软件,规范了核电建造的管理,满足股份公司、建设公司、核电项目部多层级单位使用。产品主要实现核电项目部的核电安装、土建施工业务的全过程管理,系统包括8大板块共30多个业务领域,能够满足核电工程的项目管控、资源管控、计划控制、安全控制的全面、全过程的核电建造管理。
三、核电施工领域数据特点
核电施工领域由于行业的特殊性与复杂性,其数据存在以下特点:
首先,数据维度比较复杂,数据结构多样,简单来看,既有建筑类数据,也有管理类数据。
其次,行业链条多,参建方多,数据资源分散在不同单位手中,数据资源的整合存在一定困难。对于业务类数据来说,主要的设计数据存在于业主或设计单位,大量的甲供物资采购信息及供应商信息也都在业主手中。
再次,随着信息化建设的升级,各系统之间的数据继承性较差,大量的技术性文件分散于各单位。
最后,随着移动互联、物联网、区域链等新技术逐步应用于核电施工领域,由此带来了数据量的爆发式增长,也为核电施工领域数据的管理带来新的考验。
四、 面向核电施工领域的大数据平台的研究(一)技术架构
核电施工领域大数据支撑平台技术以集成成熟开源产品为主,下图是核电施工领域大数据平台的技术架构。
(二)数据存储架构
数据存储关键技术是分布式文件系统及基于分布式文件系统的各类数据库。基于核电施工领域大数据平台的选型,分布式文件系统主要采用Hadoop的HDFS,HDFS有着高容错性(fault-tolerant)的特点,并且设计用来部署在低廉的(l o w-c o s t)硬件上。而且它提供高吞吐量(highthroughput)来访问应用程序的数据,适合那些有着超大数据集(largedataset)的应用程序。HDFS可以实现流的形式访问(streamingaccess)文件系统中的数据。满足对分布式、扩展性、容错性、低成本的要求。
(三) 数据分析架构
数据分析子系统总体架构主要包括分析工程、数据接入、数据处理、数据分析、场景/故事设计、成果发布等模块,实现数据分析平台业务的全面支撑。
(四)数据分析结果
选取某核电站项目部数据,选择电气施工中的支架安装工作量分析,数据库中支架安装相关数据表及说明如下:
通过对基于厂房及区域、厂房及时间、厂房及标高的工作量分布分析,可以得知在某几个厂房工作量较多。通过对工作量的分析,有利于进度计划的调整及优化,有利于对工作计划的安排优化。
五、总结
通过本文的研究,提出了核电施工领域大数据平台的技术架构、数据存储架构和数据分析架构,提出了建设核电施工领域大数据平台的建设路径,为后续开展与业务相关的大数据分析提供了基础。
图1 核电施工领域大数据平台技术架构
图2 核电施工领域大数据平台存储架构图3 核电施工领域大数据平台的数据分析架构
图4 不同维度的工作量分析结果