如果说语音交互是车载场景的最佳方式,未来谁掌握车内语音交互 " 话语权 ",谁就将主宰车辆智能网联的新时代!这样说一点也不为过,这就像是手机领域,从诺基亚塞班系统称霸天下,过渡到安卓等智能手机时代的变化一样。
现如今,在国内车载语音交互领域,说科大讯飞是老大,估计没人会有不同意见。今年年底,科大讯飞的产品在汽车领域即将达到 1500 万台前装的装配量。而促成这种量的除了好用外,科大讯飞还有一点厉害之处,在于" 开放 "。
近日,科大讯飞在合肥的 1024 开发者大会上发布了飞鱼 OS 系统,而这套车辆网领域的系统同样是开放的:汽车 AI 技能开放平台、硬件开放和运营组件开放。
技能开放平台:这个平台可以支撑开发者或客户的技能 1s 上线,实时生效。最重要的是,这个平台可以帮助客户或开发者能有效的收集用户数据并且通过智能化分析,优化和不断打磨自己设计的技能。
硬件开放平台:可以接入车机硬件、座舱硬件、后装设备,第三方智能驾驶、辅助驾驶接口,客户和合作伙伴可以快速集成和使用。
运营组件:目前很多科大讯飞的合作伙伴开放了 API,车载系统也早已实现了去 APP 化,讯飞还开发了场景模型和各种生态接入接口,为合作伙伴提供相关运营组件通道。
飞鱼 OS 作为与主机厂深度融合的智能车机系统,目前已经有六家车厂,十款车型实现量产上市。
但如果你以为科大讯飞只想做汽车界的安卓系统,那你就太小看它了。因为科大讯飞目前在自动驾驶的关键技术——视觉图像识别方面也掌握了领先技术。
你以为科大讯飞只有语音厉害?其实它的视觉图像识别也非常强悍!
最近,科大讯飞在刷新 Cityscapes 评测中,终结了英伟达的保持的记录,刷新了两项子任务的世界记录。目前科大讯飞的图像识别系统应用于医疗、教育中,在汽车领域后期将在 360° 辅助安全驾驶上展开应用,对于图像识别的自动驾驶领域开展,刘俊峰表示,对所有伙伴开放,不排除后续在自动驾驶方向研发。
▲像素级图像场景分割任务榜单
▲实例级图像场景分割任务榜单
科大讯飞刷新 Cityscapes 评测全部两项任务世界纪录
什么是 Cityscapes 评测?
Cityscapes 评测任务是由奔驰主推,提供在驾驶领域进行效果和性能测试的图像分割数据集。该评测任务关注真实场景下的道路环境理解,用于评估参与测试的算法在城区场景语义理解方面的性能。相比其他自动驾驶领域的测试数据集,Cityscapes 任务难度更高,更加贴近自动驾驶等当下热门需求,近年来的热度也不断攀升。
科大讯飞智能汽车业务在过去 10 年主要为行业提供智能语音助理和车载系统 2 个产品,语音助理几乎支撑了整个行业新汽车产品上市,涉及从自主到合资的大量车厂。它的每一次升级,都带来行业对语音交互方式的认知升级,代表车内语音交互的前沿趋势。
发布了飞鱼 OS 系统后科大讯飞从产品形式上进行了升级
软硬分离:双层级+多生态,通过双层级 + 多生态的模式建立起飞鱼 OS 软硬分离的能力,拆分了两个层级,LITE 版和 PLUS 版。并且通过飞鱼 OS 可以快速实现集成和对接。PLUS 版比 lite 版更深度定制系统的 framework 层,甚至一些 hal,kernel 层的部分模块。
仅仅将软硬分离的外界对接工作做好还不够,讯飞考虑到每一家车厂的车联网服务能力差异较大,(真是操碎了心)讯飞通过对后台能力的兼容和拓展,能为车厂定制兼容更大的多生态集合,从而保证用户在手机上常用服务和能力能够很好的使用。
在最终的用户体验效果上主要做了 3 点提升
全闭环的汽车智能语音交互核心技术,包含语音合成、声源定位、窄带波束、声纹识别、智能打断、语音唤醒、语音识别、自然语言理解、听歌识曲。
多音区方案,随着车内更大空间的趋势,讯飞实现了车内的多音区方案,以保障能够支持后排乘客更好的使用智能语音。
从能听会说到察言观色,除了从声音维度的优化提升外,讯飞还开放了车内车外的视觉感知能力,从而让驾驶更安全。
从技术角度增强了汽车听、说、看三个维度的能力,听的部分在声纹识别和降噪模块的基础上增加了多音区能力;听的部分,在技能平台、AIUI 的基础上,增加了 XTTS 和音效;看的部分,在 360 的基础上,增加了人脸识别和疲劳识别能力。
科大讯飞人机交互系统大升级未来的三个方向:
多模态交互:就是将多种传感器,比如麦克风、触摸屏、摄像头等技术,融合人工智能识别和理解技术,实现的多场景呈现和交互的能力。在多场景下,采用多种交互方式融合,从而给用户提供更加接近人类的沟通方式,比如增加的疲劳识别、人脸识别等能力就是为了让多模态交互做到更好的。
多乘客交互:多乘客交互是科大讯飞在行业里首次提出并开创,目前第一步已经在蔚来汽车 ES8 上实现落地,首个场景是当后排的乘客说 " 打开车窗 ",这时候在这位乘客的一侧的窗户会被打开,但不会影响其他人的车窗。
情感化交互:讯飞希望能够让每一个人都有一个自己的 AI. 虚拟个人助理,人机交互一定会往类人的多情感方向发展,所以讯飞依托人工智能技术,用情感化设计语言和拟人化设计打造的具有更加懂我能力的个人虚拟助理。
本次,科大讯飞不仅发布了飞鱼 OS 系统,还公布了上半年业绩,悦听计划和开发者基金计划。但车扯认为,科大讯飞本次发布会透露出布局自动驾驶的目标已经非常明确。相比传统汽车厂商和新造车品牌,科大讯飞、高德等互联网企业在自动驾驶领域的鲜明技术优势也颇具看点,而对于我们消费者来说,开放融合是我们最欢迎的,毕竟用谁家的产品不是重点,能够享受到更好的服务和更好的产品才是关键。
- E N D -
留言与评论(共有 0 条评论) |