贺文/文
“芝麻开门”,阿里巴巴用这句魔力咒语打开了宝藏山洞的大门,马斌斌和乐驾科技想用“你好 萝卜”这句话,最大限度地解放驾驶者开车时的双手。
马斌斌身上,有诸多互联网大公司的标签,搜狐前30号员工、雅虎中国第一个产品经理、腾讯电商和视频产品负责人、高德地图产品副总裁……而他的这一站是乐驾科技,与思必驰这家专注于做智能硬件的语音交互技术的公司达成战略合作,做一款“ HUD+语音操控+人机对话”的智能车载机器人“车萝卜” (Carrobot),希望让传统汽车变得更加“智能”。
在高德的经历,让马斌斌发现了人车交互场景中的用户痛点颇多,比如驾驶的同时查看发送微信、查看地图导航等,这些在开车时都是很危险的。而现在所有的系统,不管是前装车上做的车机系统,还是后装的应用,包括手机的应用,都不能很完美的解决这些痛点。
于是乎有了“车萝卜”这样一款智能人机交互的全语音车载产品。在马斌斌看来,在驾车场景里,更重要的人机交互模式是耳朵听、解决信息的输入,用嘴说、解决信息的操控,真正做到人机对话。
减法
马斌斌一直心心念念要做这样一个产品,机缘巧合,他在2014年底认识了高始兴,思必驰的创始人之一,双方一拍即合。
思必驰的语音交互技术,尤其是支持多步骤的人机对话技术,正是马斌斌需要的,“我试了一下他们的原型产品,真的是这样,能达到我们的要求”。当然,要在车载这样特定的应用场景里实现很好的人机交互,仅仅用思必驰提供的AIOS人机对话智能操作系统的API接口再开发是不够的,所以双方决定战略合作。乐驾针对车载环境深度定制研发了自己的ROM系统,并接入高德地图导航、考拉音乐电台、微信等应用,未来还将接入更多适合车载场景的应用。
马斌斌坦言,乐驾“车萝卜”的诞生受Navdy的启发,但他同样有信心,基于乐驾所掌握的语音操控人机对话技术,乐驾“车萝卜”能做出比Navdy更强大的人机交互功能。
美国汽车抬头显示器Navdy公司最早提出了放在仪表台上的HUD+语音操控这个产品概念,但是乐驾“车萝卜”却抢先一步实现了产品面市:2015年1月乐驾公司成立;5月底做出了工程原型机;7月开始京东众筹,并成为明星项目;9月底,交付用户;此后,通过大量的用户使用发现和反馈的问题,软件产品进行快速迭代,每月至少推出一个版本。
“萝卜。导航。”在接受记者采访时,马斌斌演示了车萝卜第一代产品。
“请说目的地。”车萝卜回答。
“首都国际机场T3航站楼。”
“找到以下地点,是第几个?”
“第一个。”
“目的地,北京首都国际机场三号航站楼,如果目的地不正确,您可以说取消。”
不仅是地图导航,还有微信、音乐、接打电话的通信功能,车萝卜将这几项基本应用做成一体化的、真正能满足开车的特定场景需求的集成方案,而且都是基于语音交互的。为此,乐驾团队在软硬件上都没有少下“狠功夫”。
这与之前的很多语音助手、车载语音导航产品的开发思路完全不同,后者当驾驶者说导航去哪里之后,接下来的事情还是需要用手来操作,因为这样的语音助手只是入口,之后启动的还是诸如高德或者百度的导航。
而乐驾的“车萝卜”是在设备的ROM底层上做了“四合一”应用层,就是四个事情同时并发进行,如何在体验(反应速度)和硬件性能(CPU运算能力)上找好平衡,是乐驾团队要解决的重点难题。比如,对ROM层进行深度的定制开发,把不需要的模块都砍掉,提升性能、减少不必要的内存占用;比如挖来了手机圈做BSP驱动(操作系统的一部分)和ROM侧开发的高手,还有智能手机供应链的资深人士。
马斌斌介绍,车萝卜的二代机已经在开发中,会有“高低配”不同版本,其中高配版(8核CPU)的响应速度希望能降到一秒之内。
从“后装”到“前装”
现在的车萝卜是一款HUD平视显示器,以车载外设的形式,固定在车内驾驶位的仪表台上。马斌斌畅想,未来的HUD可以不再是用一个单独的小屏幕、作为车内外设,而是直接在车的前挡风玻璃上显示交互信息。
事实上,像宝马这样的整车厂商已经在做了。不过,马斌斌认为,汽车整车厂商的优势是有很好的硬件基础,可以做最合理、最完美的图像显示,但是它们的软件开发能力弱。即便是宝马,现在也还只能在车的前挡风玻璃上显示简单的信息,比如车速、转速、油耗,以及前方500米右转、左转这样的基本监控,还没有办法做到在车辆行驶中比较详细的路程导引;在语音操控方面,包括宝马等整车厂商在内的语音操控都还不能做到完全的语音交互,在语音发出第一个指令之后,接下来的事情都得用手来做辅助操作。
现在车萝卜还是2C的产品形态和销售模式,专注于汽车的后装市场。马斌斌介绍,今年车萝卜在线上和线下两个渠道都要发力,线上会在京东、天猫、淘宝、国美、苏宁等电商平台上销售,线下比如4S店、汽配城、修车连锁等都是可以拓展的。后装市场,尤其像中国这样的汽车保有量大国(现在已经是1.7亿左右的私家车保有量),已经足够大。“即便是把目前中国存量汽车市场做好,已经是足够大的业务,要大于新车。”马斌斌说。
但是,前装市场不能不做战略考虑。尤其是未来的新车产品,像HUD、语音操控等,一定会变成标配时。马斌斌希望在未来用户足够多,平台量级足够大的情况下,以“第三方服务商”的角色,同汽车生产商进行深度合作,比如作为汽车厂商在智能人机对话车载机器人的解决方案提供商。
当然,相较于后装车市场,前装车市场的技术门槛更高,技术验证周期更长,前装车厂对安全是非常慎重的,所以任何一个新技术、新产品要进前装市场,进口整车厂商至少三到五年,国产品牌两到三年。
对于乐驾来说,在人车交互这个领域可以探索的东西很多很多:
比如产品性能,现在的车萝卜主要是识别来自于正前方的驾驶员的声音,新产品通过硬件在麦克风阵列上的改进升级,将能实现更好的声源定位,进而能区分来自驾驶员、副驾驶、后排座椅等不同位置的人声;在产品形态上,现在的车萝卜是HUD平视显示器,未来是不是可以变成眼镜;在商业模式上,比如进入线下渠道时,能否尝试硬件低价甚至免费的模式等等。