机器学习热得不能再热了。机器学习作为一种人工智能,使得计算机能够学习执行任务,进行预测,而不需要详细的编程,这一技术在众多的流行技术中非常火,但对于大多数企业而言仍然是有些遥远的概念。由于技术进步和新出现的体系架构,机器学习可能很快成为主流。
咨询公司德勤预计明年机器学习的使用和采用会大幅度增加。这在很大程度上是因为技术越来越普遍了。该公司的最新研究显示,全球有超过3亿部智能手机,或者说2017年销售的五分之一以上的智能手机将具有机器学习功能。
德勤的技术、媒体和电信业务主管Stuart Johnston说:“以中央处理单元、图形处理单元或者专用现场可编程门阵列形式出现的新芯片技术能够以合适的价格、尺寸和功耗提供满足智能电话应用的神经网络处理功能。”
Johnston说:“机器学习软件增加了这些硬件后,将支持本地程序设计模仿人类大脑的某些结构和功能,能够应用于诸如室内导航、图像分类、增强现实、语音识别和语言翻译等领域。从日常用户的角度来看,这意味着复杂的任务会更容易,更加个性化,更快速,隐私性也更好。”
各行业的公司已经在使用或者试验机器学习技术。下面来看看三家公司怎样利用机器学习获得巨大的商业效果。
把希望“钉”在数据丰富的图像上社交媒体网站Pinterest(拼趣)在2014年开始涉猎机器学习技术,开始时主要投入到计算机视觉技术上,并建立了一个工程师小组,工作重点是重塑人们发现图像的方式。
不到一年后,该公司推出了“视觉搜索”,这是一种不需要文本查询来搜索信息的新工具。Pinterest的数据科学主管Mohammad Shahangian说:“第一次,视觉搜索让人们拥有了获得结果的一种新方法——即使他们找不到合适的词汇来描述他们要寻找什么。”
视觉搜索应用了深度学习技术——这是一种版本的机器学习技术,它采用了深度神经网络,通过视觉搜索,Pinterest自动地探测任意一副图像中的物体、颜色和模式,并推断出相关的物体。Shahangian 说,Pinterest每月除了20亿次的文字搜索外,还有超过2亿次的视觉搜索。
2016年夏天,视觉搜索演变为Pinterest推出的物体探测,它实时查找‘钉图’(pin图)中的所有物体,并提供相关的结果。 (下转第3版)
Shahangian说:“今天,视觉搜索已经成为我们最常用的功能之一,每月会有数亿次的视觉搜索,数十亿的物体被检测出来。现在,我们在视觉发现基础设施上引入了三种新产品。”
Pinterest拥有互联网上最大的数据丰富的图像库之一。Shahangian说:“我们使用机器学习技术不断地对750亿个动态物体进行排名和衡量,从可购买的‘钉图’到视频,并在最合适的时候为适当的人显示正确的‘钉图’。我们的核心焦点是帮助人们发现引人注目的内容,例如要购买的产品、要制作的食谱、去尝试的项目等,机器学习帮助我们为人们提供更个性化的体验。”
Shahangian 说,Pinterest在扩展其国际用户群时,发现无论人们住在哪里、说什么语言、兴趣是什么,为他们提供个性化的服务是最重要的。他说:“使用机器学习模型,我们在过去一年中将美国以外国家的本地‘图钉’(pin)数量提高了250%。现在,每月访问Pinterest的1.5亿人都会看到与他们的国家和语言 最相关的‘图钉’。”
此外,机器学习可以预测网站上促销‘图钉’的相关性及其表现,采用企业的促销理念来帮助改善用户体验。
Shahangian 说:“ 我们最近在建议候选渠道中增加了深度学习,进一步提高了有关‘图钉’的相关度。Pinterest工程师已经开发了一种可扩展的系统,随着我们产品和人们兴趣而不断发展,所以我们能够呈现出最相关的建议。通过应用这种新的深度学习模型,早期测试显示,相关‘图钉’的交易全球增长了5%。”
Shahangian 说:“Pinterest正在不断地开发最新的机器学习技术,以便构建视觉发现引擎,包括推进物体探测的发展,给世界各地的人们提供不断增长的数据库以及全世界数据丰富的图像。”
构建高维模型
另一家使用机器学习技术的公司是软件提供商Adobe Systems,据Adobe Research副总裁Anandan Padmanabhan的说法,他们多年来一直使用监督和非监督机器学习以及统计模型来帮助其业务的运行。
随着Adobe的业务向基于云的订阅服务的过渡,两个基本推动因素导致公司内需要大规模的机器学习:在线渠道成为获取客户的主要来源,以及促进产品接触和留住数百万客户的需求。此外,通过机器学习,采集到的关于客户与某些产品接触的数据信息更详细了。
Padmanabhan 说:“Adobe通过产品使用、营销和客户支持来采集事件级别的纵向数据,以构建各种类型的预测模型。”这些模型包括付费转换和保留模型、客户保留模型、自动特征提取和细分、加售和交叉销售模型,以及最优分配和基于细分的预测模型等。
公司用于其机器学习工作的工具包括Python Scikit-learn、Spark ML、SAS和专有的内部方法。
Padmanabhan 说, 机器学习方法帮助公司建立了个人层面的高维模型。他说:“以前,Adobe利用统计工具开发更多的聚合模型,完全忽视了个人层面的不同特性。”
对Adobe来讲,机器学习的主要优点是更好地了解付费媒体的边际影响,从而能够更好的分配各种销售渠道的媒体接触点;以及能够理解个人客户倾向和生命周期的各个阶段,这些都有助于推动营销活动。
该公司还通过更好地了解各个产品的使用方式以及对营销活动的反应,提高了客户参与度,从而带来更多的定制产品,客户支持体验也更好。这反过来也有助于留住客户。
此外,Adobe的企业销售和区域规划也有了改进,这提高了销售效率;开发了一种连续性的方法来定义和分析整个企业关键绩效指标,这使得公司能够在共同的体系架构中评估所有的活动。
鉴于目前为止非常成功,该公司正在继续寻找其他的选择以充分发挥机器学习的优势。Padmanabhan说:“Adobe有强烈的意愿利用机器学习去管理客户体验的方方面面。”
为客户管理风险
金融风险管理服务提供商LexisNexis风险解决方案(LNRS)公司采用机器学习来帮助客户防止身份被盗、洗钱、福利诈骗、医疗保健欺诈、坏账和其他风险。
LNRS 的技术架构和产品副总裁 Flavio Villanustre 说,LNRS 几年前开始使用机器学习从非常大的异构数据池中提取信息并进行分析,创建图表并预测事件。
该公司主要使用基于HPCC系统自己开发的机器学习工具,该系统是用于大数据处理和分析的开源、大规模并行处理计算平台。
Villanustre 说:“ 在处理复杂模型并需要扩展以应用于规模非常大和多样化的数据集时,这一平台给我们带来了优势。”在HPCC 平台之上,LNRS以域专用语言的形式设计了自己的域专用抽象语言,例如复杂的记录链接工具——“可扩展自动链接技术”,以及将图像分析与机器学习能力相结合的“知识工程语言”。
Villanustre说, 在 机器学习之前,通过算法进行建模时,要求人们了解特定的问题域,从现有数据中提取事实,并编写大的“启发式”程序,使用条件规则对输入数据不同的可能结果进行建模。他说:“这些早期的系统需要专家筛选数据以理解现实,并通过计算机可以理解的条件语句来描述它。这是非常乏味、辛苦的工作,最好留给计算机去做。”
Villanustre说, 机 器学习改变了这一切,让计算机提取这些事实,并通过基于统计方程的模型来表示现实。他说:“这极大地节省了域专家的时间,使他们能够使用人类采用其他方法很难处理的数据集。所得到的计算机程序更简洁,更易于实施,更高效。”
LNRS使用机器学习来描述企业和个人的整个网络,以识别诈骗团伙。它还使用该技术来评估和预测信用和保险风险,识别医疗保健相关交易中的欺诈,并帮助抓到犯罪分子。
Villanustre说:“机器学习是我们所做的一切的核心。”该公司正在研究最新的技术更替。他说,深度信念网络——由多层潜在变量以及层之间的联结组成的生成图形模型,还有深度学习最近有一些进展,是有希望的应用领域。
Villanustre说:“对于我们来说,非常重要的是,确认这些新方法符合我们所在各个国家的法律法规,这样才可以让个人和社会最大限度地受益于使用这些新方法。”
机器学习成为主流
德勤的Johnston说,机器学习的应用可以是多样化的,涉及到各行业,包括零售、汽车、金融服务和医疗保健等。
Johnston说,在某些情况下,这将有助于改变公司与客户的互动方式。例如,在零售业中,机器学习能够完全重塑零售客户体验。使用面部识别技术作为客户识别工具,这方面的能力在不断提高,很多公司以新方式来应用这类工具,例如,亚马逊的Amazon Go商店以及其Alexa平台。
Johnston说:“Amazon Go通过使用计算机视觉、传感器融合以及深度学习或者机器学习避免了结账,我预计很多购物中心和零售商今年会开始尝试类似的选择。”
智能手机等普通设备将具备机器学习功能,这一事实意味着该技术将不再局限于理论或者高端应用。
Johnston说:“具备机器学习功能的新兴智能手机技术的例子包括通过压力传感器确定用户心情和情绪的程序、使用健康数据进行健康和生活预测的程序,以及探测周围物体的程序。”
Johnston说,不仅智能手机,无人机、平板电脑、汽车、虚拟现实和增强现实设备、医疗工具以及一系列物联网设备都将会采用机器学习,使用这些产品的行业都将具备机器学习能力。
Bob Violino是纽约《计算机世界》的特约撰稿人,在纽约工作。
原文网址: http://www.infoworld. com/article/3180998/ application-development/ machine-learning-provesits-worth-to-business. html