杂志汇中国信息化

应用是气象大数据的价值所在

作者:文 | 沈文海
现任国家气象信息中心副总工程师兼科技委主任,教授级高级工程师职称;多年从事气象信息化建设工作,是我国气象部门信息化发展的见证者。目前主要从事气象信息化发展战略及相关问题的研究。

由大数据而掀起的数字经济热潮,在全社会已沸腾数年,气象大数据在这一热潮中随波逐流,飘荡东西。回顾这几年的发展脉络,成绩固然不少,但就笔者一些同事的观点,却也难称成绩斐然。因为在他们看来,既然冠以“气象大数据”的名称,其成效就应当具备“气象大数据”的专有特色。然而经过认真分析后他们发现,现在相当数量的“气象大数据”成果,与数年前的常规气象数据业务成果,在原理和方法上并无本质差别。这使得他们禁不住发问:有别于传统业务的、专属于气象大数据的工作,究竟有还是没有?都有哪些?如何定义“气象大数据应用”,如何区分“气象大数据”与传统意义上常规气象数据业务之间的差别?如此等等。

事实上,就连什么是“气象大数据”,它的范围轮廓应如何界定,目前在内部都尚未达成共识,以至于一些同事私下里对目前“气象大数据”的官方定义颇不以为然,认为它太不精准、太不科学了。

这些问题的确带来不少困惑。

气象大数据的本质

如同西方音乐的发展历程经历了巴洛克、古典主义、浪漫主义以及现代和后现代等各个时期一样,气象数据的发展也经历了若干时期(限于篇幅,不予赘述),目前进入到了“气象大数据”时期。

同样,如同浩如烟海的音乐作品最终都是由七个音符组成的一样,气象学科所面对、所处理的,始终是“温(温度)、压(气压)、湿(湿度)、风(风向风速)”这几个基本要素。气象学科一百多年的发展,归结到数学层面,无非是算法的不断改进,以及算法所分析处理的数据在采集的时空密度和精准度方面的不断提高而已。因此,无论“气象大数据”如何神秘、如何炫目、如何令人赞叹和惊讶,回归到气象学科的本质,最终都仍然要以“温、压、湿、风”这几个基本要素的面目出现和存在。

因此,对于气象学科的核心业务:气象预报而言,较之传统的气象数据,“气象大数据”的本质并没有改变,它只是气象数据在目前新的形势和潮流下的一种发展和延伸。

一个交响乐队里,固然有经过严格标校音准的各种乐器,也有音阶不那么精准的乐器,如:鼓、镲等打击乐器。事实上,只要可以奏出和谐的符合主题的乐曲,即便枪炮声和马蹄声也可以出现在乐曲中。因此,气象行业的科学家和工程师们实在没有必要把宝贵的精力和时间花费在甄别气象大数据的种类和边界上;如同音乐家们一样,与其为某件乐器是否属于交响乐队而争论不休,不如认真分析思考演奏某支乐曲究竟需要哪些乐器、究竟如何善用这些乐器,方能够将乐曲的构思和意蕴完美地表现出来。

经过这些年全社会各行各业出于各种目的对大数据进行的富有本行业特色的定义、注解和补充,大数据的概念已由最初的“现有技术处理不了的大规模数据”,演变成了现在的“逢数必称大数据”的混沌状态。在当下,大数据已经成为一场运动、一种时尚、一个寄托美好向往的神话。在不少人(甚至包括一些领导、学者和专家)眼里,一个以数据为对象的项目或课题,如果不冠以“大数据”的名称,该项目便显得陈旧、显得落伍、显得不与时俱进。气象部门人微言轻,无力也没有责任梳理和整肃这一混沌局面。我们所应该做的,既不是人云亦云地随波逐流,也不是愤世嫉俗地质疑和挑剔,而是应当冷静地思考:气象大数据究竟能给我们带来什么?是预报水平的提高?是服务能力的加强?是探测手段的进一步丰富?还是其它什么别的效益?

要想搞清楚这些问题并不容易,仔细分析这些年一些咨询机构发布的大数据应用典型案例可以发现,真正使人眼前一亮的实际应用并不很多。

当然,至少有一点可以肯定:身处大数据时代,气象部门不必经历那些传统制造业等实体行业所必须经历的艰难而痛苦的数字化转型——气象部门干的就是数据采集、数据分析和数据服务,气象业务本身就是信息业务,气象工作就是数据工作。

气象大数据建设并不等价于气象大数据中心建设

与大数据应用成果雷声大雨点小的现象相反,这几年以大数据冠名的“大数据中心”却如雨后春笋般茁壮成长、遍地开花。时下一些地方政府出于利用数字经济带动当地产业发展的角度考虑,先后出台了一系列鼓励行业大数据产业化的政策,使当地许多行业深受鼓舞,气象部门亦在其中,据传闻,一些省的省级气象大数据中心已在筹划之中。

熟悉计算机机房业务的人们都清楚,按照GB50174-2008、GB50462-2008以及TIA-942、AN-SI/TIA942-2005等一系列有关规范,数据中心(尤其是大数据中心)的建设技术水准和运行维护能力是有相当严格的要求的,这些要求的满足需要付出相当高的成本。因此,数据中心必须具备一定的规模,才可能通过规模效应尽可能降低建设和运维成本。

按照工信部划分数据中心规模等级的算法:超大型数据中心是指规模大于等于10000个标准机架的数据中心;大型数据中心是指规模大于等于3000个标准机架小于10000个标准机架的数据中心;中小型数据中心是指规模小于3000个标准机架的数据中心。(注:此处标准机架为换算单位,以功率2.5千瓦为一个标准机架)。而现在即便是正在建设中的国家级的气象大数据中心,其规模也小于1000个标准机架,属于小型数据中心。可以推算,省局“气象大数据中心”的规模将远小于1000个机架,属于超小型数据中心。常识告诉我们,在一个地方建立有限的几个大型数据中心、以承载和运维当地各行业的基础设施,与各行业自建数据中心、从而导致当地超小型数据中心遍地密布,二者的建设和运营成本是存在很大差异的。后者的建设和运营成本很难有效降低,富余资源也很难全社会共享。换句话说,从经济层面考虑,采用后一种方案是很不划算的。

因此,地方政府(省里)对本地大数据中心建设的统一规划十分重要。如果在没有统一规划的前提下便开始着手在本省建立面向行业的省级行业大数据中心,那么可以想象,不久的将来,除了该省的“气象大数据中心”外,其它诸如“农业大数据中心”、“旅游大数据中心”、“交通大数据中心”、“商贸大数据中心”等一系列所谓“大数据中心”都将一一建设起来,从而出现“行业大数据中心”建设四面开花、群雄并举的局面,导致该地区数据中心严重的“产能过剩”。

从数据应用的角度来考量,如果出现行业大数据中心四面开花的局面,而又无法有效解决这些“行业大数据中心”之间的数据交换和应用等核心问题,那么,一个个行业数据孤岛将以行业大数据中心的形式再度出现,并借助行业大数据中心的形式而得以强化。这是我们避之唯恐不及的可怕局面。

应用才是气象大数据的价值所在

必须强调,推动数字经济(或曰大数据产业),一定要聚焦在应用上,因为“应用”才是数字经济的核心。数字经济的核心在于“用”,在于盘活数据、使其真正被社会使用起来,而不在于数据中心的建设以及数据中心建在何处。发展数字经济与大数据中心建设之间没有必然联系,有了大数据中心未见得就有了良好的数字经济,数字经济的高端附加值也不在数据中心这里。必须认识到:数字经济强调的是从数据中提炼价值,而不是建设机房以及楼堂馆所。走访过牛津、剑桥大学的人们都清楚,那里的大学城没有什么像样的富丽堂皇的建筑,但却硕果累累、人才辈出。因此,如果没有新的应用领域和应用思路、没有新的算法以及推演出新算法的数据科学家团队,即便大数据中心建得如何金碧辉煌,也不过是一具没有灵魂的躯壳而已。

对于气象部门而言,积极参与地方政府“发展数字经济”是职责所在。但我们心里必须明白:发展数字经济绝不仅仅意味着气象大数据中心建设,其实际落脚点必须落实在气象数据的广泛和深度应用上。因此我们必须认真思考并逐步明确:除过去的常规业务外,气象大数据究竟能为地方经济建设带来哪些新的经济增长点。一定要强调气象数据的新的应用,无论是深度应用,还是拓广应用领域。待想清楚了这些问题之后,再来讨论省级气象大数据中心建设不迟。否则有可能出现建成了气象大数据中心,而数据应用在该省却没有多少新的起色的尴尬局面。

因此,在做出省级气象大数据中心的建设决策之前,我们应当首先明确:

该项建设是否符合中国气象局整体战略规划,是否符合“集约化、标准化”的信息化建设原则。

本地区是否已有相应的大数据发展、建设和应用规划,该项建设是否与之相符。

该项建设对本地区大数据的社会应用和发展有无实质性的推动作用,如何推动。亦即:该项建设完成之后,本地区的气象大数据应用将有哪些新的领域得以拓展,新的深度应用得以推进;是否会使气象大数据在应用的广度和深度上进一步加强,以及如何加强。

该项建设能否有效避免未来可能出现的“行业数据孤岛”以及“数据中心产能过剩”等问题。

待上述问题想清楚后,再来判断该项建设是否可行,亦为时不晚。

总之,气象数据应当动起来、用起来,而不仅仅是造一个数据中心把它装起来。不断创新应用,不断深度挖掘,才是气象大数据真正的价值所在。

 

把握新时代融合发展的新方位持之以恒做好两化融合这篇大文章

应用是气象大数据的价值所在

蜀有云:成大事者能平稳运行近四百系统

融绘城市经济未来,如何做到心中有“数”?

合同管理进入智能时代

工业互联网APP培育工程实施方案(2018-2020年)

相关文章