使用网络搜索和社交媒体进行预测并不是最近才有的现象,经济学家可能是研究使用大数据以预测市场动态和相关问题的较晚的职业之一。虽然存在着这样那样的复杂性,从股票市场到房地产市场等众多研究,从在线大数据中获取信息的预测能力都正在获得广泛的支持。虽然房地产基本面是市场的主要驱动力,情绪也在定价方面发挥作用。尽管解释了难以解释的真实数据,但对于作为泡沫产生和破裂根源的情绪数据来说,实际上更具挑战性。
网络信息的预测力
互联网和社交网络服务的出现,以及智能手机的广泛传播,彻底改变了我们交流和交流信息的方式。在这样的大背景下,近年来不断增加的用户在线活动带来的大数据已经成为一个热门词汇,因为它在市场营销、政治预测、疾病控制、社会动态分析等多种用途上具有极大的潜力。
范里安开创性的研究展示了使用谷歌搜索查询数据何以作为包括汽车销售、旅游等在内的各种经济活动的关键预测指标。前人的成果刺激了经济学领域的后续研究,这主要集中在利用大数据来增加对涉及自身所关切利益的经济变量的预测模型的预测能力。
Choi H. &. Varian H.(2012)认为,Google Trends每天都在产生大量与经济发展相关的查询结果,且这些查询结果与当下的经济活动之间必然存在着不容忽视的关系,或许可以对预测当下的经济活动起到非常重要的作用。
许多机构和研究人员基于这些网略行为数据来源,对很多宏观经济问题做出了研究,Sun Y.(2010)研究了网络搜索与通货膨胀之间的相关性,Suhoy T.(2009)和D’Amuri F. &. Marcucci J.(2009)分别通过网络搜索引擎提供的数据预测了以色列与德国、意大利的失业情况。
现在,越来越多的研究在利用Google Trend进行经济监测和预测,除了通胀与失业的情况以外,Google Trend已被广泛应用到房地产、旅游、零售业、个人消费、投资、金融等诸多可以反映宏观经济及市场景气形势的领域。
法国有关专家学者为该国市场构建了谷歌情绪指标,并发现了其与常用的替代情绪指标的相关性。基于VAR模型的实证检验表明,投资者情绪可对短期市场回报具预测,投资者情绪和股票回报率之间在两周前的负相关性非常普遍。
另有专家学者确定了98个与股票市场相关的搜索词,并发现在股市下跌之前,其搜索量的增长之间有联系。研究表明,基于这些早期预警信号的交易策略明显优于随机投资策略。此外,根据他们得出的结论,国家与国际SVI相比,更有效地解释市场趋向,这可能是因为美国互联网用户中(私人)交易员的比例高于全球。
不过,经济学家可能是研究使用大数据以预测市场动态和相关问题的较晚的职业之一,使用网络搜索和社交媒体进行预测并不是最近才有的现象。
2008年成立的谷歌流感趋势,利用谷歌的搜索引擎追踪了25个国家流感的传播。但随着该项目难以做出准确预测,人们对该项目的兴奋之情逐渐消退。2014年的《自然》(Nature)杂志肯定了社交媒体的“大数据”价值,但同时警告说,“我们离一个他们可以取代更传统的方法或理论的地方很远。”
搜索查询可能包含用户后续行动的信息的想法是基于这样一个前提,即生活在当代社会的经济代理人在作出重要的经济决策(如购买耐用商品和金融投资)之前,很大程度上依赖于先前的信息搜索过程。
然而,信息需求的动机并不总是朝着这个方向发展;加强信息收集活动本身可能是对市场重大事件的简单内生反应的表现,以寻求更多的信息,这可能会对下一轮的市场发展产生一定的影响。这些错综复杂的信息需求和市场结果之间的因果关系使得很难正确地评估大数据的真正重要性。
尽管存在这种复杂性,但从股票市场上到房地产市场上等的众多研究,都支持从在线大数据中获取信息的预测能力。
第一项在谷歌数据中单独进行了与房地产相关的研究,调查了谷歌搜索指数对美国50个州的房价和成交量的影响。得出的结论是,搜索指数的增加与交易量和价格的上升正相关。此外,与主要类别(例如,房地产)相比,谷歌子类别(例如,房地产中介)的更高适用性通常被强烈显示。
该研究在美国州的50个州测试了谷歌搜索引擎数据对住宅市场销售和价格的预测能力,当他们调查以(子)类别的“房地产”和“房地产中介”来预测房屋销售的能力时,“房地产”显示不出任何意义。另一方面,“房地产中介”的分类似乎与销售有很强的相关性。
“房地产”类别和房价之间没有明显的联系,这可能是因为其在其所捕捉到的搜索(例如物业管理、房地产开发)方面具有广泛而未指明的性质。相比之下,房地产中介机构在未来四分之一的时间里是一个很好的预测者,但在不同的模型规范中,同期的关系是不同的。通过测试预测的准确性,该研究认为谷歌搜索指数增强模型的表现比没有谷歌的更出色。
Kulkarni等学者基于城市层面的房地产相关关键字推出谷歌搜索指数,并测试其对美国20个最大的大都市统计区(MSAs)的“Case Shiller指数”的预测能力。通过进行双向回归,他们提供了谷歌搜索指数对房价有“格兰杰”因果关联的证据,但不是相反。 Hohenstatt等学者在全美20个最大的MSAs中确认了这些结果。测试谷歌搜索数据是否为住房市场模型增加了解释力,他们发现搜索数据显著提高了适合度,尤其是在细分类别“房地产代理”作为交易的一个非常可靠的指标的地方。
而学者Beracha和Wintoki调查了美国314个MSAs,并生成了“房地产”和“租金”的单一搜索查询。通过对房价异常收益率的推论,他们发现,与低迷时期相比,搜索量对上涨的价格有更高的敏感度。
搜索趋势“见”情绪
尽管有不同的理论作为依据,传统观点基本一致认为房价与交易量之间存在正向关系,当然也有一些学者如斯坦认为交易量领先于价格。所有这些理论,以及建立在这些理论基础上的扩展,都集中在价格与交易量之间的关系以及相互作用上。然而,缺失情绪的不足业已被一系列的研究广泛证明了。
由于房地产市场因其异质性而效率低下,而情绪因素可以描述市场变化的一部分,可这是公认的无法解释的基本面。研究发现,虽然房地产基本面是市场的主要驱动力,情绪也在定价方面发挥作用。
随着因特网用户数量的增加和搜索引擎使用量的增加,利用搜索引擎提供的网络搜索查询数据这种收集市场数据的新方法变得越来越流行。人们通过搜索产品说明,选择各种替代品,以及他们指定的要购买的东西,创造出一条线索,向搜索引擎揭示他们打算购买的东西。搜索引擎提供商可以跟踪这些信息,Google凭借其独特的利用Google趋势工具公开提供的搜索查询数据,提供了适当和强大的数据基础。
越来越多的学术研究以谷歌搜索查询数据为研究目的,深入于各个经济部门,包括房地产研究领域。基于用户对特定感兴趣领域信息的需求得到了很好的满足,谷歌作为情绪指标的潜力被充分揭示了。这有助于研究人员对不久的将来作出推断。
除了通胀与失业的情况以外,Google Trend已被广泛应用到房地产、旅游、零售业、个人消费、投资、金融等诸多可以反映宏观经济及市场景气形势的领域。在越来越多的针对不同经济部门的研究,尤其是房地产研究领域的研究成果的支撑下,谷歌的数据有可能同时考虑到消费者情绪的变化,从而能够对现实世界近期的未来做出推断。
这一优势可以很容易地用于销售力度(例如房地产机构)的分配和时间安排。这一系列研究也为及时提供政策建议提供了一个有价值的指标,因为政策建议在其他方面取决于数据,而这些数据在报告之前往往会出现时滞。这是Google数据的主要优势,因为社会经济信息只能在很长的时间内才能获得,而且由于样本较少,调查可能会有偏差。
谷歌搜索量数据克服了许多这样的问题。谷歌通过其工具“谷歌趋势2.0”(Google Trends 2.0)提供可公开访问的搜索查询数据,该工具是从“Google Insight for Search”发展而来的。与其他情感数据集不同的是,时间延迟几乎可以被忽略,因为Google的数据在收集的两天后便可获得。此外,与基于调查的指标相比,数据收集所需的努力要少得多。还有,样本量比较大,避免了上述问卷偏差等问题。
Hohenstatt和Kaesbauer等学者指出,尽管解释了难以解释的真实数据,但对于作为泡沫产生和破裂根源的情绪数据来说,甚至更具挑战性。
在没有买卖双方匹配的情况下,纯粹的买卖兴趣可以通过谷歌的数据来衡量。提前还款决定的复杂动态(即利率调整、现金流出、住房周转)取决于个人、社会经济情况。在模拟房主决策时,跟踪消费和储蓄行为的变化、信用价值的变化、房主的信念是一项具有挑战性的工作。个人对损失的厌恶是婚姻状况或婚姻状况的变化、非/就业、年龄等一系列社会经济特征的组合。
谷歌的数据可以用来帮助监控这些集群的情绪动态。例如,热点可以通过谷歌搜索来识别,用来暗示有压力的抵押贷款与失业、收入或其他传统信贷市场指标等硬数据相背离,类似于谷歌潮流趋势背后的推理。
当涉及到与房地产相关决策的联系时,如何用不方便的工具跟踪情绪数据的问题甚至更具挑战性。谷歌的子类别房地产中介和家庭融资提供了一个答案。个人通过输入特殊的搜索词来显示他们的意图和兴趣,相对来说是不偏不倚的。同时,跟踪这些搜索词,并基于许多不同的搜索词创建索引,这些搜索词从而指向相同的方向。这一特征通过影响给定子类别的前10个搜索查询来证明。
对于房地产代理,搜索词范围从房地产经纪人、宅基地、房屋出售、地产出售到以向某些经纪公司询问的方式查询房产,如Zoopla,第一太平戴维斯或PrimeLocation(英国,2004—2010)。家庭理财融资子类的前10个搜索查询词汇是:抵押贷款、富国银行(Wellsfargo)、抵押贷款计算器、抵押贷款利率、全国范围、住房贷款、富国银行、止赎、FHA和住房抵押贷款,反向抵押、FHA贷款甚至封闭性的搜索查询量不断增加。
在没有买卖双方匹配的情况下,纯粹的买卖兴趣可以通过谷歌的数据来衡量。提前还款决定的复杂动态取决于个人、社会经济情况。
商业地产中的应用
住房要么作为自有住房,要么作为创收资产,而商业地产通常只用作后者。这在一些时期尤为明显,例如,出售和租赁回购交易很流行的时候。与典型的购房者不同,商业房地产买卖双方主要是专业人士,目的是使他们的收入最大化。
商业地产比住宅少,但前者的单位价值通常要高得多,它们构成了一个不同的资产类别。因为它们在规模、价值和跨部门(零售、办公、工业等)方面差异很大,这使得它们更难相互比较。良好的预测对商业房地产行业的重要性非常显著。在选择未来投资时,房地产投资者感兴趣的是什么类型的房地产市场比其他类型的市场发展得更好。
机构投资者,如保险公司或房地产基金,在分配资金时通常有一个特定的投资视野。因此,它们对不同地区和部门的房地产市场表现作出了含蓄和明确的预测。房地产咨询公司发布市场报告,其中他们给出了市场活动和运动的前景。地产发展商在进行可行性研究时,特别关注未来租金和价格的发展。银行和其他房地产融资机构在作出信贷审批决定时,对市场走向感兴趣。
商业地产的独特属性使得该市场的行为与普通房地产市场有所不同,这使得商业地产市场在预测方面成为一个特例。虽然有关商业房地产预测的文献不如关于住房的文献全面,但仍有许多研究对市场行为的预测进行了研究。
目前已达成广泛共识的是,基本经济指标“不能充分考虑到未来的回报变动”。这意味着有一些无法观察到的影响市场的因素,而这些因素并没有被基本面所捕捉到。务必引起重视的是,情绪在定价方面也发挥作用,当然,尽管房地产基本面是市场的主要驱动力。
有研究发现,从Probit方法中使用的商业趋势调查得出的信心数据,在欧洲三大写字楼市场产生了可接受的早期租金增长转折点信号。这两项研究要么使用基于调查的情绪指标,要么使用共同的领先经济指标(例如出口订单、零售销售、汽车登记等)。
虽然情绪/领先指标在预测行业中的应用前景广阔,但也存在一些不足。首先,这些指标大部分都是在两个月内公布的。就以调查为基础的指标而言,数据收集既昂贵又费时。此外,被指定的回答者是否总是实际回答问题单的人是值得怀疑的,如果是的话,她是否总是如实回答问题。后者也可能与担心泄露敏感信息有关,因为缺乏匿名标准。出口订单、汽车登记或零售销售等领先指标不受这些问题的影响,但就其基础而言,与房地产市场完全脱节。
德国雷根斯堡大学国际地产商学院三位教授的一项研究明确表示,利用这类指标对高度复杂的商业房地产市场进行月度预测似乎有些不尽人意,不过,谷歌搜索量数据可以克服许多此类的问题。
与其他情感数据集不同的是,时间延迟几乎可以被忽略,因为Google的数据在收集的两天后才能获得。更不用说,与基于调查的指标相比,数据收集所需的努力要少得多。此外,样本量比较大,避免了上述问卷偏差等问题。搜索量索引(SVI)可以过滤某些类别或关键字,以使索引的情况具体。如果使用正确,SVI应该显示搜索者需要的信息,并且不失真。从2004到现在,GoogleTrend用户每周都可以检索和下载在线搜索查询的历史日志。
Dietzel和Braun等学者增加了罗伯茨和亨内贝里设计的交易模型,以突出投资者利用互联网的各个阶段,从而揭示他的具体兴趣。不可否认,一个(大型)专业机构投资者,很难在互联网上简单地“谷歌”购买他想购买的房产。这当然是有道理的,因为一个大投资者很可能会直接与房地产经纪人取得联系。不过,通过进行在线研究,就像投资/研究部门通常在为未来投资决策收集信息时所做的那样,投资者最终还是会显示出自己的兴趣。有关专家学者坚信,越多的搜索者表现出这样的兴趣,对房地产的需求就越大。