杂志汇IT经理世界

巨头如何在云端搞机器学习?

作者:塞尔达·耶各拉普/文 刘荻/编译

IBM、谷歌、微软和亚马逊这四大云巨头都将机器学习作为一项服务来提供,但是它们实际开展的方式就跟这些公司本身一样大不相同。

塞尔达·耶各拉普/文 刘荻/编译

任何一个云想要受到重视,就得满足功能方面越来越高的标准。机器学习似乎也在这份功能名单上,因为各大云服务提供商现在都以此作为一项主打功能。

但是它们如何搞这一块又是另一码事。除了“精选API vs开放式算法市场”这种模式外,还有“一应俱全vs刚刚好”这种变种模式。IBM、谷歌、微软和亚马逊这四大云服务提供商在机器学习方面的玩法如何?

IBM:Watson掌舵,控制航向

IBM初次宣布要把Waston人工智能系统转变成一项消费服务时,问题接踵而至。它会是什么样子?它将如何被消费?但最重要的是,它会给予多大的支持,帮助IBM竭力将自己重塑成云巨头?  

两年后,IBM已经在其Bluemix平台即服务(PaaS)上推出了一系列基于机器学习的服务(比如天气预报),或者用于分析语言、识别图像、翻译语言、分析情绪和语调等方面的系统。

在云端提供某种机器智能的所有公司当中,IBM的目标最野心勃勃。更重要的是,IBM还一直在竭力用更接地气的工具补充高大上的工具,主要涉及分析和报告。(日益改进的Waston似乎也是IBM在天气和医疗保健等多个领域,宣布多次战略性收购的动力)。

问题不是Waston服务会不会得到实际采用――它们迟早会得到实际采用,问题是这些服务会不会以IBM觉得舒适的步伐得到采用,IBM对此可谓孤注一掷。这些服务大多数需要时间才能找到使用场合,而IBM早已被广泛接受的Spark服务(或者其类似AWS Lambda的新服务:OpenWhisk)更容易立即赚钱。

一些企业组织已经开始另辟蹊径,将Watson的分析服务投入使用。但是,虽然IBM表示它认为自己能够把这一切发展成年收入达100亿美元的业务,但是Waston到目前为止得到的采用根本不足以抵补IBM 一路下滑的收入。

微软:为客户而建

IBM有Watson,微软则有Project Oxford,这是一组经过精选的高级API,涵盖机器视觉、语音识别和语音分析。虽然API不如Watson的API来得广泛(咱们还是面对现实吧,Howold.net不如参加智力竞赛电视节目《危险边缘》的Watson那么有趣),但是微软的野心几乎如出一辙:借助一套充分利用机器学习的经过精选的专有API。

Azure Machine Learning Studio也许是微软的机器学习野心中更重要的一部分。人们可以拿来自己的数据,在上面训练机器学习模型,然后通过REST接口,将因而获得的模型作为API重新共享。IBM在Bluemix上的Predictive Analytics服务也有类似功能,不过微软的Studio问世时间更久,而且让人觉得更加通用。

IBM和微软都试图创建两种不同版本的机器学习服务。一种版本是关起门来构建的(一向如此),提供一套精选的数据集和经过改善的行为(Watson API和Project Oxford)。另一种版本是一个平台,新型的机器学习服务可以在上面构建、共享,甚至赚钱(Azure Machine Learning Studio和 Predictive Analytics)。

但是微软和IBM最大的区别不在于服务,而在于动机。微软试图转向云计算,以便自己能够适应未来的形势,这一战略得到了其他成

功的业务领域(比如游戏)的帮助,因而它并没有感觉到像IBM那么大的生存压力。但是这并不是说,微软就不知道该走哪条路。

亚马逊和谷歌:极简主义者

如果说谷歌、尤其是亚马逊有一个原则作为其云计算解决方案的指导,那就是“少即是多”。也许更贴切的说法是“刚刚好嫌多”,这包括这两家公司提供基于云的机器学习服务的方式。

以谷歌为例,谷歌云平台(Google Cloud Platform)目前只提供两种类似本文介绍的其他机器学习服务的服务:Google Translate(这是支持谷歌现有的机器翻译引擎的API)和Google Prediction API。前者是一种专有的API,由谷歌独家维护。后者尽管名字不起眼,却是一种包容性广泛的服务,允许用户上传数据,并训练模型,其方式如同微软Azure Machine Learning Studio。(数据可以从Google BigQuery之类的谷歌服务获取)。

Amazon Machine Learning类 似Google Prediction API,原因在于模型可以用数据来训练,并用来进行预测。这是一种有意简化的服务,为的是吸引只想解决某个特定狭窄问题的开发人员,或者是由于亚马逊想先试水市场。

在亚马逊和谷歌这两种情况下,它们的目标都是开发人员,这个群体有狭窄定义的要求,又有已经在那些云上的数据――这就是“刚刚好”模式。IBM和微软将目光投向广泛多得多的领域,虽然IBM努力想拥有最多的服务,但是输得最惨的可能也是它。

 

Wacom:构造数字墨水世界

京腾计划“数说”社交 + 电商

Qlik:开启宇航员视角的BI

威胁无处不在思科 BDA 安全应对之道

后社交媒体营销时代:员工能否为企业“带盐”

数据变现时代

相关文章