如今,利用大数据方法和技术进行宏观经济预测越来越受到宏观经济政策制定者和学术界更高的重视,国内外许多机构和研究人员进行了大量研究和应用,产生了一系列意义深远的成果。基于大数据进行的宏观经济预测和分析,将发生多方面的变革,并且呈现出显著的优势。不过,由于数据来源、技术研发等多方面的限制,以大数据为基础的宏观经济分析现在尚并不能完全取代传统的宏观经济分析。
宏观经济预测和分析何以借助大数据
长期以来,各国政府都非常注重对影响总需求、总供给、国民生产总值、物价水平、就业率、财政收入、货币和信贷总量等因素的信息进行搜集、整合、分类、加工和处理,进而在获得一定认知的基础之上,对宏观经济调控和调节的策略和手段做出决定和选择。这在很大程度和范围内解决了经济运行中的“市场失灵”,解决了许多市场机制难以甚至无从解决的问题。
可是,受制于科学技术发展水平和时代的局限性,政府宏观调控(或调节)抉择中所能够获得的信息,往往只是部分信息、滞后信息。在这样的背景下,不仅“市场失灵”问题不能完全解决,而且,政府宏观调控还往往会出现“政府失灵”的问题,从而饱受诟病。
大数据时代,科技水平和技术手段存在着搜集和提供完全信息的可能性。政府可以通过对极大量、多维度和完备性的大数据进行搜集、整合、分类、加工和处理,也就存在着获得实时信息、完全信息和准确信息的可能性。毫无疑问,这为政府采用大数据思维模式进行宏观调控创造着条件。
当前,随着互联网等新一代信息技术的发展,涉及生产经营销售活动和人们交往交互情况的、实时的、非结构化的海量数据不断涌现。整个社会周而复始地创造和运用大数据所催生的新经济,正在诱导或驱动着追求最大化的个人、厂商和政府直接或间接利用云端(云计算)和运用人工智能来处理和匹配大数据,以实现消费和投资的理性选择(何大安,2018)。而在这实时、交互、离散化、非结构化的海量数据中,蕴含着经济社会运行的各种先行指标信号。
正因为如此,大数据不仅是国家新型战略资源,也是评判经济走势的支撑。党中央、国务院高瞻远瞩,深刻把握新兴高技术变革带来的这一重大机遇,对大数据的整合、分析、利用做出了系统部署。
“十三五”规划纲要中指出“完善政策制定和决策机制:注重运用互联网、统计云、大数据技术,提高经济运行信息及时性、全面性和准确性”。国务院相关部门正在积极采取多种方式开发社会上数量巨大、来源广泛、形式多样的大数据,并与政府信息整合,构建大数据经济分析模型,对国民经济各领域的运行状况及时监测,提高了宏观调控的精准性和有效性。
现在,大数据对宏观经济分析的革命性影响,越来越受到宏观经济政策制定者和学术界更高的重视。目前,国内外运用大数据的概念、方法和技术进行宏观经济分析的研究主要集中在宏观经济预测(尤其是现时预测)、宏观经济政策制定、宏观经济分析技术和宏观经济数据挖掘等领域。
从已有研究来看,在宏观经济预测中运用大数据的方面,从新型宏观经济指数构建,到在传统宏观经济模型中运用大数据成果,再到建立新型大数据宏观经济预测模型,一些意义深远的研究工作逐步兴起。
通过梳理相关的一系列研究可以看出,基于大数据进行的宏观经济预测和分析,将主要在四大方面发生变革,并且呈现出显著的优势(见表格所示)。除此以外,还有学者指出,以大数据做宏观经济预测分析,还将派生出相对低成本、颗粒度高等其独特的优势。
由于网络大数据均在事件或交易发生时自动被记录下来,无须人为调查和搜集,通过技术方法提取出来加以整理得到,能够极大程度上降低获取数据的成本。同时,传统的数据搜集过程为了降低成本,会尽量搜集总体数据,而非细化地搜集数据信息。而在网络大数据时代,提取总体数据信息和单独搜集某一类别的数据的区别并不大,可以在不显著增加成本的前提下,提供更加详细和更加有意义的数据信息。
国内基于大数据宏观预测的新进展
目前,利用大数据方法和技术进行宏观经济监测预测已经在国际上引起相当程度的重视,不同机构的学者和研究人员已经进行了大量研究和应用,而且产生了丰硕的成果。但从国内来看,这一领域的研究和应用都处在起步阶段,与国外相比,还有很大发展潜力和空间。
国内生产总值(Gross Domestic Product,GDP)作为衡量一个国家或地区宏观经济整体状况的核心指标,其长短期走势和增速拐点判断通常是宏观经济预测的重心。目前,利用大数据预测GDP走势的研究主要是综合使用网络搜索数据、网络爬虫数据等大数据以及传统政府统计数据,结合经典时间序列模型、计量经济模型以及新型的高维数据模型、机器学习等方法进行预测,并把“预测(Forecasting)”的内涵拓展到“现测(Nowcasting)”。
清华大学经济学研究所的一项研究表明,在充分利用了GDP自身信息和其它结构化的统计指标的基础上,再增加互联网搜索行为几乎总能有效地改进预测。
对于GDP预测而言,如果在政府统计变量的基础上,增加互联网搜索行为变量则可以帮助改进预测。
清华大学社会科学学院刘涛雄教授指出,其背后的机理是:一方面,新兴非结构化大数据信息往往包含了大量的噪音,从信息质量而言,相对于传统的统计数据具有明显劣势,但并不构成对传统统计数据的替代。另一方面,新兴非结构化大数据往往包括了传统统计调查数据所没有的其它信息,如最新的实时信息,因而是对统计数据的有益补充。
互联网是大数据时代人们经济生活不可或缺的工具,人们的网络生活占据日常生活中愈发重要的位置,信息获取方式向网络渠道转移。通过对网民搜索行为的分析可以得到用户的关注重点和消费需求,尤为重要的是,由于网络搜索数据具有即时性的特点,可以实时反映用户心理变化和需求变化,许多学者将网络搜索应用到预测需要传导时间的指标或经济行为的研究中。
中国科学院大学管理学院学者孙毅和吕本富依据百度指数中的搜索数据构建基于网络的消费者信心指数(ICCI),可以更准确地预测社会商品零售总额,作为领先宏观经济景气一致指数的先行指标,具有更强的预警能力。刘伟江等学者利用主成分分析法合成分类搜索指数,研究了网络搜索关键词与台湾地区消费者信心指数之间的关系,所建立模型能够较好地预测出消费者信心指数的拐点,模型拟合度亦较高。
在宏观经济运行中,物价总体水平的波动反应着宏观经济运行状况,亦是经济发展和社会稳定的重要影响要素。随着经济结构的调整和经济的复苏与繁荣,物价水平的上升成为必然,然而,过低和过高的通货膨胀水平均不利于经济的稳定发展。提前准确预测未来的通货膨胀水平一向极为重要。
孙毅和吕本富的另一项研究表明,基于百度数据而合成的网络通胀预期指数与通货膨胀趋势高度相关,并证明了我国通货膨胀预期是一种适应性预期。而张崇和吕本富利用关键词合并的方法得到搜索指数,而后构建模型对CPI进行线性拟合,证明了网络搜索数据与CPI之间存在长期稳定的关系。他们发现网络搜索数据与居民消费价格指数(CPI)之间存在一定的先行滞后关系。他们建构的模型具有很强的时效性,比国家统计局的数据发布提前一个月左右,而且与传统的预测方法相比,模型还具备一定的转折点预测能力。
国内学者也在利用搜索大数据研究失业率方面有所探索,王勇、董恒新(2017)利用网络搜索数据,采用5种不同的预测方法研究分析了中国季度失业率问题,研究表明基于网络搜索数据预测的失业率能够比官方数据更早反映失业率趋势变化。而彭庚等(2013)利用Google提供的关键词搜索数据,采用改进的逐步回归方法分层建立了三个模型来预测失业率。结果发现,三个模型的拟合优度均在90%以上,说明网络搜索数据对经济、社会问题可以进行有效的预测。
总的来说,上述研究都表明网络搜索关键词和经济行为之间存在密切的联系,引入网络搜索数据的研究预测更加精确、误差更小。
大数据应用于宏观经济分析的主要瓶颈
目前,由于数据来源、技术研发等多方面的限制,以大数据为基础的宏观经济分析现在尚不能完全取代传统的宏观经济分析。
最近发展起来的大数据以及大数据相关技术,无论是爬虫技术,还是分布式储存技术,抑或是云计算等,这些都是围绕大数据获取、保存和应对超大型数据的计算问题而发展起来的技术方法,而真正能成为大数据独有的宏观预测模型却较为缺乏。并且,大数据在分析经济问题时,更多地是采用描述性的方式,较少采用结构性的方法来分析,缺乏经济理论支撑。
眼前,应该以传统宏观经济分析为主,辅以大数据方法,不断提高宏观经济分析的精准性、客观性和时效性。中国社会科学院数量经济技术经济研究所学者指出,通过大数据技术和方法,获取及时性的数据,结合传统的宏观预测和分析模型,既能有效利用经济理论解释经济问题,又能通过大数据获取的数据信息突破传统统计数据存在的问题,有效提高宏观经济预测和分析的效果,为宏观经济预测和分析带来新的突破。
总之,大数据并不是对传统宏观预测模型方法的革新,而是对传统模型宏观经济分析预测方法的补充和改进。应积极通过对传统统计分析方法使用数据的改进,突破传统方法的根本局限,从而提高模型的预测效果和应用范围。
在大数据分析的运用、提高效率与其他政策和技术协同,以及为公共服务领域带来变革等方面,政府可以加大重视和投入力度,为经济的进一步发展提供支持。首先,面对大数据带来的技术变革,政府应该将其纳入政府统计之中。经济统计要充分利用大数据时代提供的技术和条件,促进政府统计工作的变革。
其次,面对大数据带来的统计资源的拓展,政府应该将其统计资源拓展到政府以外,重视拓宽其他数据资源。在过去,政府靠自己的力量收集数据,但在大数据时代,人人都是数据的制造者。例如,谷歌和百度等数据巨头拥有大量政府无法获取的数据资源。政府要想办法让数据巨头将数据放到统计中来,而不能仅靠自己调查统计。
再次,面对大数据带来的统计对象扩充,政府不但应当重视结构化数据,更应当重视挖掘非结构化数据,以期找寻出恰当的经济统计指标。大数据时代,非结构化数据包含更多信息,而且利用互联网进行的数据挖掘,不仅可以得到数字资源,文本数据也可以通过挖掘获得。国家自然科学青年基金项目的一项研究认为,对于政府统计部门而言,应利用政府的影响力优势不断加强对基于信息技术的非结构化数据(包括来源于网络的与宏观经济相关的文本图像等)的收集与整合。
最后,无论是关于宏观经济的结构化统计数据还是非结构化整合数据,都需要提高数据的频率,如周数据日数据等,高频数据才能发挥大数据实时性的优势,对宏观经济进行及时预警与风险管理。
在大数据分析技术方面,机器学习等数据挖掘方法在图像或语音识别自然语言处理等方面的应用已发展成熟,同样,机器学习对复杂知识的获取能力会使得它应用于宏观经济分析成为一种必然,这就需要学者们进一步探究宏观经济分析与大数据技术之间成功的契合方式,并在此基础上构建专门的宏观经济预测系统,实现对宏观经济实时有效的监控和风险管理。