打响智能音箱战役,语音内容是技术核心

明势资本作为国内极少数专注在科技创新领域的早期投资机构,人工智能是我们重仓的赛道之一。明势在AI领域的核心投资逻辑很直接,“没有落地的应用场景,没有产业化和商业化的能力来帮助行业提升效率的人工智能创业都是耍流氓”。

换句话说,明势看重的是AI技术在每个具体领域的应用。出行是我们认为AI最大的落地场景,在自动驾驶领域明势投资了易航智能和知行科技。知行科技在今年3月成为了Mobileye Tier1合作伙伴中的全球唯一初创公司,拿到了上汽、众泰等主机厂的合同,车型订单超过每年10万台;易航刚刚完成一轮融资,很快就会公布。

在AI+法律领域,我们投资了思满科技和秘塔科技等;在AI+医疗领域,投资了智能医疗外科手术机器人研发商术康医疗等;在AI+工业领域,投资了智能工厂解决方案供应商玄羽科技等,玄羽已经可以通过传感器,以AI的算力帮助富士康在全国的产线做到增效和减员。

在智能家居领域,近期最热的AI落地应用当属智能音箱,明势也对该领域进行了深入的探索。昨天,明势资本创始合伙人黄明明和小米生态链副总裁唐沐作在“腾讯创业01CLUB”就语音智能技术和智能音箱的发展做了一期不掺水分的对话。

以下为此次对话内容的整理:

黄明明:路由器曾被认为是小米串起智能家居的入口,现在是否把这个任务交给了智能音箱?你认同未来智能家居的流量入口可能是智能音箱吗?

唐沐:先说智能家居入口的问题。从2012年、2013年开始,很多公司都在对此做尝试、设想、去做相关的产品。当时对于公司的自家产品,对外都会有这样的一个说法:在做争夺智能家居入口。兄弟不才,我当时是做了路由器,所以对外喊“路由器是未来智能家居的入口”。

做了几年之后,我发现当时喊的凶的说自己是智能家居入口的,到最后都没留下来,反而那些真的踏踏实实的,把一个产品做到满足用户的高频刚需的产品才能留下来。

你要问我路由器是不是入口,其实路由器也不是,我相信路由器只是智能家居其中一个的中心节点。

智能家居的中心未必是一个设备,很有可能是几个设备。我回想起雷总邀请我加入小米的核心诉求是希望我能探索智能家居,路由器只是其中一个重心节点。

参与到智能音箱的项目后,我发现智能音箱是另外一个维度的智能家居中心。但现在我不太想强调它是一个中心,目前我们做产品的思路转化成为:我们可以把一个产品设想的很宏大,我们可以想象很多东西,给它留很多未来的发展空间的设想,但最根本的你要先把它的高频刚需满足掉。

路由器是家庭的网络连接中心,智能音箱是家里的语音交互中心。路由器做到现在我们有大概2000多万台的销售,日活1000多万台,每天服务一亿多个连接在互联网上的设备,是一个名副其实的网络连接中心和数据中心。

智能音箱我希望可以做到有趣,有趣之后再去想它未来能否成为一个中心。

黄明明:在技术方面,你认为那些底层技术的突破,推动了智能音箱这一波高速发展?目前还有哪些突出的问题是严重影响到用户体验的?比如远场的定位,本地软硬件计算能力,多人的声场还有误唤醒,包括多轮对话能力等。

唐沐:当我们开始做智能音箱的时候,我发现主要有3个核心技术要准备好:一个是ASR,语音转文字的技术,语音识别技术;一个是NLP,自然语言理解技术;一个是TTS,文字转语音,文字合成语音的技术。

这三个技术基本上是智能音箱存在的一个基石,当这三个技术准备好了,智能音箱已经具备了横空出世的前提了。

关于核心制约瓶颈,远场的定位,本地软硬件计算的能力,多人的声场还有误唤醒,包括多轮对话的能力这些都是,有很多可以通过数据的积累,人工智能自我学习、自我进步去改善的。但我认为到目前为止,可能基本上目前我还没有看到有解决的很明确的路径,其实是NLP自然语言理解。

很多时候目前我们在智能音箱里面呈现出来的人工智能,它有点像是一个简单的问答机,你提一个问题他给你一个回答,很多时候这种回答还是偏机械,离真正的人工智能还是有点距离。

黄明明:看来大家的认知至少目前比较一致,最难突破的核心还是在NLP领域,可能我们所谓的深度神经网络基本上就在这个领域。那么抛开短期内最难突破的NLP,以小米的小爱音箱为例,你认为哪些技术方案上的选择才能让产品有特点和优势?

唐沐:我们做智能音箱最棒的心得是广泛寻求合作。

比如说我们在ASR领域有七八家合作伙伴,我们会把用户的query同时发给七八家合作伙伴,等他们全部都反馈给我们结果,我们再经过一个简单的判断算法,来决定选取谁的结果。

小米在技术上花费精力最大的还是NLP,这是智能音箱的核心,也人工智能语音助手的核心。

以小爱音箱为例,我们目前有两大看家本领,一个是对用户点歌query的理解,一个是对用户IoT控制的理解。

我们发布音箱的时间比较久,收集到的query比较多,这会极大帮助我们更深入理解用户的诉求到底是什么。

黄明明:有传言小米正在跟亚马逊和微软接触合作,是否属实?如果有这样的考虑,小米是否会花更多力量在硬件的生产制造方面?

唐沐:所有传言都是无风不起浪,谷歌、亚马逊、微软,这几家在我们发布智能音箱之后都找来了,他们更多看重小米在智能硬件领域里面的供应链优势跟性价比优势。

但是大家也知道小米从来不是一个只甘心于做硬件终端的一家公司,所以我们在挑选合作伙伴的时候,一定也是在考虑在互联网领域合作共赢的可能性。其实目前都还在谈,我们不会只做硬件,而不碰里面的系统和背后的大脑的。

黄明明:感谢唐沐兄的坦诚,也给我们爆了很多料。那么既然刚刚提到了跟国外巨头的合作,那么跟国内垄断性的拥有海量内容的巨头,包括腾讯音乐和阿里这些公司的竞合态势如何,是产品之争还是内容之争?目前市场上比较主流的声音是用户最关心的还是获取的内容,而内容主要掌握在BAT手里,小米如何应对?

唐沐:我觉得答案一定还是合作共赢。小米虽然已经IPO,但我们内部还是认为自己是一个创业公司,我们永远没有办法有财力和BAT等一些互联网巨头比拼内容的采购。

我认为其实各家公司都有各家公司擅长的地方,有各家公司的“基因”。比如就音乐而言,腾讯一定是有它的基因在的,否则TME也不会做这么大。

所以我花了很大的精力去跟腾讯去谈合作,还能让大家都做各自擅长的事情:小米擅长是做硬件做系统,腾讯TME集团擅长做音乐,我们就强强联手一起合作就好了。

一方面我们会和QQ音乐合作,一起为小爱音箱的用户提供相当大部分的免费音乐。另外,我们也愿意帮助QQ音乐以及背后的这些音乐版权公司去发展音乐会员,这个应该是两边都非常愿意看到的。

另外,其实在合作的谈判过程当中,我也欣喜地看到在国内的内容产业也越来越良性发展,已经有非常非常大的用户群愿意去为好的内容买单,给了我们很大的信心。

我们在小爱音箱每天的两三千万的query数里面看到,其中占60%、70%,甚至70%、80%的,都还是对内容的获取的query,关于对内容播放控制的query。

这个可说明一点:其实语音内容必定是国内几乎所有智能音箱的核心诉求,并且是高频刚需。

黄明明:我也很赞同你的说法,每家公司的基金不同,还是要合作,每个人把自己擅长的事情做到最好,还是有机会的。未来的竞合环境如何,随着时间的推移,确实还会有很多变局。在小米生态方面,无论亚马逊还是国内其他音箱都加入了屏幕的概念,小米的智能音箱会否考虑加入屏幕?

唐沐:其实关于智能音箱要不要带屏幕这个考虑,确实也有过很多次的思考,但目前还是有些矛盾点需要解决。比如说在我的设想当中,语音交互是一种远场交互,人和设备其实是可以间隔一定距离去直接做自然交互的。

但从屏幕交互来看,从带多点触控的手持设备出现后就是一个近场交互,远场交互和近场交互在本质上有一些互斥。

在音箱上面带屏幕,会把一个本来大家可以做远场交互的设备拉近,变成是一个要求人去做近场交互的设备,这两个东西出现在同一个设备上是有一点互斥。

目前的竞争态势到达现在这个阶段的时候,我想我妄下定论可能会打脸,我也只能说到这里。

我们会积极讨论或者是积极去准备一个带屏幕的音箱,因为通过长时间的观察,我们发现其实有屏幕对于语音交互的信息反馈来说还是比较有帮助的。

黄明明:我也非常期待小米可能会有屏幕的下一代智能音箱产品出现。那么在小米的生态中,目前通过小米智能音箱互联互通的智能设备,有多少种类和数量?和其他的IoT,尤其智能家居调用的频次是什么样的比例?使用的黏性如何?

唐沐:目前连接在小米IoT云上面的设备已经超过的一个亿,这一个多亿的设备它是连接在我们,它在过去小米做IoT四五年的时间里面去逐步积累起来的。

智能音箱从去年刚刚出现的新事物,它的出现刚好把我们过去全部连接在互联网上的IoT设备做了一次更紧密的连接,它使得用户通过语音控制IoT设备的黏性大大增强。

比如说其中有一个数据蛮有意思的,叫“连带购买率”。我们从很多用户反馈和数据里可以观察到,有更多小米IoT设备的用户会更倾向于购买小爱音箱,买了小爱音箱之后,日常控制IoT设备的频度和黏性都非常高。

另外一个是说购买小爱音箱的用户,哪怕他一开始没有其他小米IoT设备,也更倾向于在买了小爱音箱之后一段时间里面积极购入小米其他IoT生态的产品。

这使得我看到了一个希望,智能家居会比以往更加接近现实,更加落地。我们过去曾经做App去控制IoT设备,很多用户会认为其实它并没有改善人的生活体验,或者是说这些设备的操控体验。

但是有了语音交互之后,很多用户会认为开灯关灯这么简单的操作频繁使用的操作,用语音控制简直是天作之合,并且很多人都养成了这样的习惯。

黄明明:我记得咱们刚认识那会儿,有一大批所谓的智能家居创业项目,但最后我们得出一个很粗暴的结论:用App控制智能家居有点“滑稽”。直到语音交互出现以后,我们认为智能家居这波以语音交互为主的场景爆发起来是非常令人兴奋的消息。很高兴唐沐兄弟今天又站在了最前沿,智能家居入口的最前沿。除了智能音箱之外,小米生态里面还有哪些是最可能成为IoT入口的产品?我非常看好扫地机器人,你怎么看?

唐沐:关于这点我们完全想到一块去了。我想其实目前小爱音箱只是人工智能助手的一个容器,未来这个助手会出现在很多的设备里面,我会为最终它的终极形态就是机器人。

但讲出机器人的这个观点,其实很多用户不一定会认同,我们做产品,我们首先可以设想如果这个产品落户在千家万户之后,它一定可以怎样怎样,但是其实第一步是最难的,怎么样让它落地在千家万户。

比如说用户得有什么样的实际需求才会花钱把它买到家里面?现在做机器人我觉得可能还是过于早,但是扫地机器人是我唯一看好的机器人形态。

很多好莱坞电影已经把用户对于智能化理解的预期提高到无限高,以至于用户会觉得买回家的机器人是一个破玩意,甚至是一个垃圾。

因为它比我们所了解的我们所曾经看到的电影里面的机器人差的太远了,机器人这个品类没法做,但是你在机器人前面加扫地两个字的时候是可以考虑的。

我认为,其实在到达最终机器人形态之前,是有一个产品的演化路径。我认为要经过三大要素。

首先是语意,声音的语意理解。AI音箱其实是搞定了AI语音的问题,它会收集非常多的query,让大脑去识别并且理解人的意图。

但是其实AI视觉是下一个要攻克的领域,无论是通过家用摄像头还是通过扫地机器人,都可以收集到足够多的数据来训练大脑理解这些图像。

第二是AI视觉的理解,第三就是它的行动部分、运动部分,这个部分的技术只要一具备,机器人形态出现就不远了。

形象一点来说,AI音箱解决的是“机器人的嘴和耳朵”的问题,后面我们还需要解决“眼睛的问题”和“腿的问题”。

终有一天,当用户习惯身边家里面有耳朵、有嘴、有眼睛这样的终端出现,他们会认为也许集合成一体的产品是有机会在家里面出现,是用户自己愿意拥有的。

2018年8月24日,亿欧将在北京举办“科技落地 物链未来——GIIS 2018物流产业创新峰会”,就传统物流企业、制造企业、物流科技应用场景及实操、物流科技新畅想等议题,携行业人士一同探讨新机遇下物流科技如何更好落地及发展走向。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();