科技智能时代新入口-语音交互(智能音箱)

上世纪80-90年代,随着电脑的普及Windows成为了当时的入口。

到了2000年internet的普及browser成了入口

随着移动互联网的普及,手机成了入口

那么在人工智能时代,什么是入口?答案是语音交互。

语音交互最大的价值就是回归人性。毕竟人是通过语言来交流的。Windows时代我们不得不用键盘鼠标、移动互联网时代,我们还是要用手指来戳戳点点我们的智能手机和Pad。到了智能时代我们可以通过和智能音箱对话,"命令"它和其他智能家具连接,从而执行命令。语音交互的核心是使用语音的场景,比如说家庭、办公、随身、车载等等。

语音语义的发展是人工智能入口承载的基础,语音合成和语音识别已经发展成熟,但是语义识别却是一个难点。特别是针对我们中国人一词多义之外,还有隐喻暗喻,你要让电脑知道这些,真的是有点困难。比如说,很简单的一句话“小明明天上学” 其实这里就等于在告诉对方,小明是一个学生。但是人工智能怎么知道?这就是一个问题了。你怎么让人工智能知道一句话背后隐含的意思。

Amazon 在智能音箱方面已经成为了领军人物。Amazon的Echo市场占有率达到71% 除此之外,Amazon公司还从软件和硬件方面把Alexa(Echo背后的人工智能语音助手)开源出去,这样Echo可以做的事情在几年内有了几何增长,从最开始的20项技能增长到1.5万个技能。2017年8月底亚马逊和微软合作,在人工智能领微软的Cortana和亚马逊的Alexa可以互相唤醒。这样就打通了Windows10和亚马逊的Echo之间的通道。Cortana从此进入了千万台的Echo而Alexa则直接装入上亿台有英文系统的Windows和Xbox游戏机里。非常了不起。

在中国,“百箱”大战已经开始。喜马拉雅推出了小雅、7月5日,阿里人工智能实验室发布智能音箱天猫精灵 X1,小米出台ai智能音箱、苹果在9月12日发布会出台HomePod等等等等。但“百箱”大战虽然红火,却可能知识表面现象。因为中国由于版权的问题,很难做到真正想听什么就听什么,想看什么就看什么。往往遇到的情况是,我能搜到一部片子,但是由于音箱的制造商不拥有该片的版权,没有办法放给你看。

现阶段人工智能的方向研究还是对更多用户的比较通用的理解。但是个性化是未来发展的方向。

一些有趣的问题:

语音交互是不是就失去了聋哑人用户呢?还真不一定。聋哑人可以通过VR捕捉到他们的手势再翻译给智能音箱听。

那是不是要更新智能家居呢?确实需要。想想你更换手机的频率吧,现在已经不是,一套家居家居在那里放一辈子的时代了。除了智能音箱还有什么?还有比如说语音机器人,例如微软的小冰。这个又可以分为专业领域和闲聊领域。对于小冰(闲聊领域的机器人)的使用过程中,我发现它还是属于比较弱智的。