热点资讯
中科院测评国内各大品牌智能音箱 2019智能音箱行业发展现状未来趋势分析
2019-12-14 11:53  点击:18

智能音箱不同于传统音箱,是音箱的升级产物,它是物联网语音入口。音箱设备作为家庭的计算终端、操作平台、搜索引擎,可以实现用户从内容点播、信息查询、家居控制等一系列的需求。

这一技术被称为人工智能(Artificial Intelligence),让机器在语音对话中拥有和人一样的能力,智能音箱是一个人工智能的强大载体,它背后是人工智能助手的能力,已经渗入人们的日常生活。

人工智能可以说是打开了物联网世界的想象。事实上,物联网与智能制造引领着新的制造业革命,各国都已在这个领域开始谋篇布局。

2014年11月,亚马逊推出首款智能音箱Echo,引发全球智能音箱热潮。随后,几年内,谷歌、苹果、Facebook等巨头纷纷入场布局。

中国智能音箱市场从2017年开始爆发,2017年市场规模约为3.1亿元。2018年以来,热度不减,特别是双十一之后的期间的降价,又引起一波智能音箱热潮。中国智能音箱市场增长迅猛,目前已成为全球第二大智能音箱市场,仅次于美国。

从2018年第一季度全球智能音箱920万个的出货数据上就能看出,越来越多的智能音箱产品正在走进人们的日常生活。如今,依托互联网技术的服务能力,智能音箱已经拥有涵盖影音娱乐、新闻资讯、购物外卖、家居控制、生活助手、儿童教育等领域的100多项技能。

Strategy Analytics副总裁David Mercer表示,中国是全球最大的智能音箱市场,在过去一个季度中,中国厂商的智能音箱出货量占全球总量的36%。在面临来自阿里巴巴和小米的激烈竞争下,百度在第三季度位居国内榜首。

中科院评测智能音箱

根据中研产业研究院《2020-2025年中国智能音箱行业前景预测与投资战略研究报告》显示,国家科学技术方面的最高学术机构——中国科学院,首次在国家机构层面对市场主流智能音箱产品的智能性进行评测。其物联网研究发展中心发布的《智能音箱的智能技术解析及其成熟度测评》报告,是目前在国内智能音箱智能度问题上,最具有权威影响力的一份报告。

本次参与中国科学院评测的智能音箱产品来自百度、阿里、腾讯、小米四家国内头部互联网公司,其产品占据国内智能音箱市场主要份额。报告结果显示,百度旗下小度系列产品智能度国内领先:在听懂、理解用户的指令方面,小度系列智能音箱是唯一听懂率超过90%的产品,无论无屏还是有屏产品均明显领先于其他品牌;在满足用户需求和体验方面,小度同样在评测中满足度得分第一,其中有屏音箱的用户满足度相对更高。

从技术层面来说,决定智能音箱智能程度的有三项技术,分别是自动语音识别、自然语言理解、内容推荐算法。三项技术指标在本次测评中分别对应着智能音箱对用户指令的听清率、听懂率以及实现相应功能的用户满足率。为保证此次测评结果的准确性,中国科学院邀请中科院微电子所、自动化所、声学所的志愿者全程进行测试和监督,且只记录最多尝试三次之后的效果,共计测试了8240次对话。

语音识别能力国内技术成熟,小度更胜一筹

测评报告显示,在语音识别能力相关的"听清率"上,各家产品均达到了较高的水准。这也意味着,当前国内主流的智能音箱产品在听清用户的话、识别人声的技术能力上已较为成熟。这其中,百度的语音识别技术又略胜一筹:根据无屏音箱的评测结果,小度智能音箱的听清率高达98%,在四家主要厂商中排名第一;有屏音箱方面,四家主要厂商听清率均达到 96%以上,腾讯叮当、小度在家1S 分别以 98.6%、98.5%的比例略微领先其他厂商。

智能音箱不是AI硬件形态

搜狗创始人兼CEO王小川表示,目前的智能音箱不是AI硬件未来的产品形态,未来智能硬件的趋势是便捷化和穿戴化,而且更具有IoT导向。

以搜狗为例,3月搜狗录音笔开卖,这是第一款完整继承搜狗AI能力的硬件。用户用录音笔可直接转写成文字,能云端存储,能够检索、生成文章的摘要。在王小川看来,这款硬件不仅是对传统收音功能改进,对语义的理解和处理也达到一个新高度,搜狗录音笔还具有同声传译的翻译能力。

王小川指出,未来的语音人工智能硬件产品将有两大发展趋势,一是从固定设备走向移动化、便携化和可穿戴化;第二是IoT(物联网)导向,即通过麦克风、各种传感器、GPS、磁力计等,从环境当中捕获更多的数据,逐步从人适应机器走向机器适应人。

基于上述趋势,王小川判断,目前的人工智能音箱产品并不是代表未来技术发展趋势的产品。

他还指出,当下人工智能领域有两个核心概念,一个是感知问题,即模仿人的大脑连接,深度学习获得语音图像的能力,这类产品形态被称为“自然交互”,机器能够产生理解人行为的能力,能够表达人类的声音和图像。

王小川举例,比如以前的输入法用五笔,后来是拼音输入,现在用户能使用表情、手势来驱动,让机器以人的方式来进行沟通,这是以语言为核心的自然交互,是跟我们的感知系统特别的相关。

另一个核心概念是“知识计算”,即在语言之上提取出跟语言相关的关联关系,再产生后面的推理能力和知识的观念能力,这叫计算能力。因此搜狗从2012年开始提出自己的核心理念的时候,就围绕着自然交互和知识计算去发展属于自己的核心语言AI能力。