人们为什么关心数据?因为数据中蕴含着商业价值。更具体地说,数据,作为一种电子化记录,描述刻画了各种各样的不确定性,而不确定性蕴含商业价值。因此,数据分析的对象不是数据本身,而是分析数据所描述的那个不确定性。同样,数据分析的目的也不是分析数据,而是创造价值。只要是能够创造价值的数据分析,都是好的数据分析。相反,则不然。对数据分析价值的判断,同数据的大小、分析方法是否高大上,没有必然联系。这种朴素的数据价值观的形成,并不是凭空臆想、突然形成的,它得益于真实的数据产业实践。
例如,有朋友很困惑地说:“我们做了一款这么棒的数据产品,数据量这么大,体验这么好,可视化创意如此独特。可是,客户怎么就不愿意买单呢?”最开始,我也有同感,但是,随着时间的推移,我的看法在慢慢改变。就像老师不能挑选学生一样,在商业实践中,我们很难挑选客户。因此,不能把数据产品的失败归咎于客户的无知,这样做没有任何建设性意义。而一个更加具有建设性的思考是:为什么我的数据产品客户不认可?归根到底是:价值不明晰。具言之,数据产品之于客户的重要业务,所创造的商业价值不明晰。这里有两个可能:一个可能是数据分析根本就没有创造价值;另外一个可能是数据分析所产生的价值难以被客户感知。无论是哪种情况,都会极大地影响数据产品的推广。
数据商业价值的三个表现
企业靠什么活着?答:收入!即使没有现在的收入,那也得有未来可预期的收入。第二,企业为了达成收入,需要做什么?答:支出(或者说成本)。收入减去支出,就是利润。在资本当道的今天,利润可以暂时是负的。第三,没有任何企业对自己未来是100%确定的,因为这里面有很大的不确定性,而不确定性带来的是什么?答:风险。接下来,就这三个方面,予以分别探讨。
第一个方面:收入。
数据产品能否帮助客户带来额外的收入?这里的关键词是“额外”。客户是卖豆浆的,以前没有你的数据分析,他每天卖100碗。后来呢,有了你的高大上的数据分析之后,如果客户开始每天销售豆浆150碗了,那么你数据分析的价值就体现出来了。这个价值有多大?就是那额外的50碗豆浆!再看一个例子:个性化推荐。客户是一个电商网站,他的主页上有一个推荐栏。过去这个推荐栏的转化率是2%。通过你的数据分析,推荐栏的转化率提高到5%了,直接大幅度提高了客户的销售收入。这额外的3%的转化率,就是数据分析的价值。
第二个方面:支出。
有人说:“我们的数据距离收入有点远,不能给客户增加收入。但是有可能给客户节约不必要的支出,也就是成本。这样行吗?”当然行啊。为什么?因为收入的增加往往具有很强的不确定性。这些不确定性来自于市场的波动、政策的变化、竞争对手的博弈等,都不在企业的控制范围内。但是支出,却更多地掌握在企业自己手里。因此,相对收入增加而言,控制支出更可预期。
假设,客服中心有1000个接线员,每天接听海量电话,解决各种客户问题,其中绝大多数问题都是很标准的典型问题。现在,通过语音识别技术,自动识别客户问题,通过AI助手,自动回答解决。因此节省下来的工作量和成本,就是你数据分析的价值。
第三个方面:风险。
还有人说:“我的数据分析,第一不能直接增加收入,第二不能直接节省成本,但是可以控制风险。这样的数据有商业价值吗?”当然有了。事实上,风险就是连接收入和支出的一个转化器。对风险的把控,或者可以增加收入,或者可以降低成本。
很多商业银行都有网上申请系统,但缺点是风险比较大,见不到真人,有些线下才能提供的材料无法获得。那就只能提高在线申请的门槛,降低通过率。这样做的优点是安全,把坏人拦在外面;缺点是错杀了很多好人。如果能够通过数据分析,帮助这家银行更加准确地区分好人和坏人,那银行就可以放心大胆地给更多的好人发卡、放贷,增加收入和利润。同时,还能保证坏账率在合理的范围之内。这样的价值是把对风险的把控,转化为收入的提高。同时,因为你风控做得好,所以坏账率就低,还节省了催收成本。这就是数据分析的价值。
建立可量化的参照系
数据的商业价值最可能体现在收入、支出、风险,但这三方面还不够。真实的业务环境很复杂,最终产生的价值(例如:收入的提高),往往难以被感知。为什么难以被感知?往往是因为缺乏一个可量化的参照系。
有业内朋友说:“我们最近给一个客户做流失预警模型,准确度75%!”但是他说领导很不满意,准确度太差,连99%都不到!客户流失行为是一个高度不可预测的不确定性行为,其中有无知的成分,也许可以通过数据分析去学习把握。但是,这里面更有无奈的部分。例如:同行竞争对手为了争夺同一个客户资源,它会采用什么手段?会产生什么效果?这谁说得清楚。因此,客户流失行为的预测不可能特别精准。但是,领导并不明了这个道理。这里最主要的一个困难是,领导对客户流失的预测精度没有一个合理的预期。因为他没有合理的参照系。在没有参照系的情况下,领导对客户流失预测精度的大小无法评估。于是,他就只好参照小学生的考试成绩:认为99%才优秀!我们应该给他树立一个可量化的参照系。
为此,可以研究一下:客户在没有数据分析的帮助下能做多好?在你到来之前,客户自己是有流失预警得分的,这个得分准确度如何?很多时候,客户自己都从来没有评价过。你可以这么说:“领导,您看,之前咱们这边的精度是65%,已经做得非常不错了。但是呢,现在咱们双方共同努力,这个精度提高到了75%。为此您可以节省多少不必要的支出,或者增加多少额外的收入,等等。”这样就更有说服力,因为你确立了一个可以量化的参照系:客户现有系统的65%。如果没有这个参照系,而你又想说明75%的精度有价值,会无比艰难。数据价值依赖于业务场景
纯粹的数据不产生价值,纯粹的算法更不产生价值。价值的产生一定依赖于具体的业务场景,尤其依赖于带有强烈不确定性的业务场景,简称为“场景”。
所谓场景就是价值创造所必须的一系列业务元素与条件的集合。两个要点:第一,有场景,就自动有价值。因为“产生商业价值”是定义“场景”的一个必要条件。不产生价值,不成为场景。第二,场景是一系列业务元素和条件,因缘际会和合而成。场景的定义跟数据没有多大关系。定义场景的关键就是创造商业价值,只要有商业价值创造就一定有场景,只要有场景就一定有商业价值创造。商业价值创造与场景互为充分必要条件。
因此,如果“数据”能够傍上“场景”这个大腿,那价值创造不是问题。毕竟,纯粹而孤立的数据,哪有什么价值?再厉害的算法也敌不过独特而精准的数据。所以,我的观点很简单:场景第一、数据第二、算法排最后。由此可见,要践行数据商业价值,首当其冲需要分析业务,并寻找高价值场景。但是,这样的业务场景应该如何寻找?
假设一个便利连锁集团的领导找到你,说:集团有上百家便利店,遍布北京各个城区,每天小十万的客流量,留下了不少购物数据。请问:这些数据能为我创造什么价值?也许你会说:咱们做个菜篮子分析吧,看看有没有可能发现一个啤酒跟尿布的故事?或者说:咱们研究研究天气吧,看看天气跟雨伞销售量有啥关系?这些数据分析所对应的场景,太琐碎,甚至压根不存在。在这样的场景下,数据所创造的价值,不可能太大。因此,场景自己的重要性极其重要,决定了数据商业价值创造的上限。如果你希望用数据创造更重大的商业价值,你需要关注企业的核心业务,在核心业务方向上,寻找重要的业务场景。
回到连锁集团的案例,你也许应该先问:领导,请问咱们集团今年的战略目标是啥?因为,战略目标决定了集团的价值取向。只有跟集团战略目标高度一致的价值才会被高度认可。因此,在数据分析之前,首先应该关注集团的战略目标,跟这个战略目标相关的核心业务,以及同核心业务相关的业务场景。也许,领导会告诉你:“我们集团现在才100多家门店,今年能否开到1000家?这是集团今年的战略目标。”请问:开店最重要的问题是什么?答:选址!因为一个位置的好坏,可以直接决定未来便利店的收入和利润。因此,“选址”即是一个业务问题,也是一个具备价值创造属性的“场景”。作为集团创始人,在选址方面都独具慧眼。开一两家新店、可能需要考察一二十家店址,也许领导还看得过来,因此跟数据分析关系不大。但是,如果要开1000家新店,那得考察多少个店址?领导不可能有精力看得过来。谁来替代?质量如何保证?
这个时候,数据分析就能帮大忙了。已开的100多家店过去的经营业绩,一定有相对好坏。而这些相对好坏和它们各自所处的位置,一定存在某种相关性。例如,一个店面业绩的好坏,是否与写字楼有关系?是否跟周围的交通量有关系?是否跟地铁站、周围的小区以及周围的竞争对手有关系?这就是数据分析要研究的具体问题,可以通过数据模型规范出来,形成一个综合科学的打分系统,从而代替领导的英明决策。这样的自动化决策系统,随着数据的积累、模型的改进,能够最终做得比领导还优秀!
这样的数据分析,瞄准的是企业战略性的核心业务,傍上了“选址”这个高价值的场景,因此产生的价值被认可度更高。
数据价值与商业模式息息相关
价值是业务的核心诉求,而后者是企业的商业模式确定的。不同的商业模式,产生不同的业务诉求,需要不同的价值体现。因此,数据价值的创造与企业的商业模式紧密相关。在不同的商业模式下,对收入、支出、风险的定义各不相同,因此对数据价值的期待各不相同。对商业模式的错误理解,可能带来错误的数据分析方向,无法践行数据商业价值。
看一个失败案例。曾经帮一个连锁便捷酒店分析数据。发现该便捷酒店的定价策略似乎很混乱,有很大的改进空间。此外,通过对历史数据的分析,发现可以用当天的数据,对明天的客流量做一个相当不错的预测。然后根据预测客流量的高低,做每日的动态价格调整,增加收入。通过对历史数据的大概测算,我们预计能够帮这种类型的分店提高至少20%的收入。
但是,当数据分析团队向对方领导汇报这个结果的时候,被泼了一大瓢凉水。对方说:“我们对这不感兴趣。”为什么?我们的分析直接瞄准的是企业收入!前文提到,数据商业价值的第一个表现就是收入,第一次听说有企业会跟收入过不去。对方说了:“我这个连锁店啊,绝大多数都不是直营店,而是加盟店。因此,作为总公司,我的收入主要来源于加盟费。由于,我对加盟店的收入不抽成,因此这些加盟店收入跟我关系不是特别大,或者至少不是我最关心的事。”
我们分析的各个分店的运营收入,是各个分店的收入,不是集团总店的收入,因此不是集团领导关心的主要问题。这是由该连锁集团的商业模式(加盟模式)所决定。因此,该连锁集团的商业模式,决定了集团总店的收入模式。集团总店的收入模式,决定了业务的核心诉求,决定了数据分析价值的方向。
跟对方进一步沟通发现,所看到的混乱定价现象,很可能是人为造成的数据质量问题。各个加盟店,跟总公司有着复杂的合作与博弈关系。它们之间,显然是要合作的,因为都在享用同一个品牌。分店向总店缴纳加盟费,总店对整个集团的品牌推广负有重大责任。但是,从分店的角度看,它们并不希望总公司对自己的实际收入情况了解太多,尤其是那些收入很好的分店。他们担心,如果让总店知道了他们的卓越业绩,明年的加盟费会增加。因此,分店有很强的冲动去虚报部分数据。
这么看来,上述数据分析结果,对于一个以加盟为主要商业模式的连锁酒店意义不大,对以直营为主的连锁酒店,也许更有意义。这说明对商业模式理解的重要性。对于一个具体的企业,正确理解它的商业模式,是创造数据商业价值的基本前提。小结
这是一个所谓的大数据时代,又是一个极其浮躁的时代。人人都在讨论数据,人人似乎都在讨论“价值”。太多人在讨论N个V,还有“砖家”说他家的AI整合了2000亿个算法!在我的眼里,这些观点和方法无法对真实的数据产业实践,做出任何有实际意义的指导。因为真实的产业实践全部基于卑微的业务。而整个行业,无论是学界,还是业界,都鲜有人从业务的角度去定义“价值”,去理解“价值”。对这样一个根本性的问题,都缺乏科学系统的见解,如何践行数据商业价值?整个行业缺乏对业务足够的敬畏,而被“大数据”“人工智能”等一大堆被定义得似是而非的概念迷惑了头脑。
(作者为北京大学光华管理学院商务统计与经济计量系系主任、教授)