随着智能家居的普及,现在我们有越来越多的房间都安装了配备有人工智能功能的智能音箱,它们的功能也基本上大同小异。但什么才能算是智能家居真正的控制中心?
最近出现的数字助手产品使得消费者要求Alexa或Google执行各种任务并提供家中每间房间的相关信息。2014年底推出的首款产品,即智能音箱(也称为人工智能音箱),至今仍然在新生市场占据主导地位。智能音箱将无线扬声器系统与AI平台相结合;起初,它们的主要功能是流媒体播放云音乐。但过去两年中,智能音箱增添了显示屏、摄像头、流媒体视频和家居自动控制灯光、气候和防盗系统。
该智能家居生态系统(图1)的出现使得家中大量智能设备成为多余摆设。而显示屏和家居自动控制等最近附加的功能导致智能设备外形也发生了改变,尽管尚未针对各个房间的需求进行优化,但它们似乎正在变得更适用于家中特定的房间。智能家居的市场正在逼近临界点,而其中智能音箱需要能够适应特定的房间,并与其他室内优化的扬声器相共存。
图1:智能家居控制中心生态系统
智能音箱基本知识
所有智能音箱均包含相同的基本组件(图2):
图2:TI的典型带屏智能音箱的系统框图
显示了智能音箱的基本组件以及一些最新的添加件
输入
智能音箱使用微型机电系统(MEMS)麦克风捕获语音,同时数字信号处理器(DSP)运行声波束形成、噪音和回声消除等算法。初始解决方案使用数字MEMS麦克风来将数字转换的比特流输出给DSP,但这种方案会牺牲一定精确度和动态范围。更高性能的解决方案采用模拟MEMS麦克风和独立的高度集成音频模数转换器(ADC)。这些ADC可大幅提高动态范围,并减少所需的麦克风数量。
输出
同一个DSP还可以处理数字音频流解码,实现均衡器功能并将音频输出到扬声器放大器。更新款的扬声器采用集成DSP的数字功放来实现对特定电气参数的均衡和修调。此外,这些小型DSP可为扬声器提供不同等级的保护,以实现在例如过温和功率输出级电压不足等不利条件下保持音质。由于数字音频内容是在芯片上处理的,因此这些放大器可以通过改变调制模式和控制功率级(基于音频内容)到输出级的路径来降低功耗。
连通性
所有智能音箱所需的主要连通形式是Wi-Fi®。尽管音频流不需要802.11ac带宽,但它已成为事实上的标准,因为众多相同的片上系统(SoC)供应商均提供视频流SoC。Wi-Fi 射频集成电路(IC)通常也集成Bluetooth®:既能保证智能手机等设备音频流用的基础速率(经典蓝牙),也涵盖配对设备之间控制和通信用的低能耗蓝牙技术(BLE)。随着蓝牙5.0技术的问世,预计会出现支持音频流的新压缩配置文件,可避免采用经典蓝牙技术。但是,为保持传统兼容性,可能在一段时间内需要同时采用这两种技术。蓝牙5.0技术还支持网状网络,这为音频流在不同设备之间的迁移开辟了光明前景——未来的智能家居只需一台设备充当音频中心即可。
添加新元素
为使消费者获得独特的用户体验,设计人员会在智能音箱上添加不同的功能。例如,使用电容式触摸屏来代替按钮,可实现更直观的控制,降低成本,并提高可靠性。在一些情况下,触觉反馈可让消费者保持熟悉的触觉体验。由于智能音箱会有不同的模式,包括响应指令,彩色LED照明模式可提供视觉反馈,并为产品增加一些亮点。此外,设计人员还可添加环境灯光传感器来调节输出亮度,由白天的强光模式调整为夜晚的暗光模式,进一步增强用户体验。
接下来,让我们来根据房间固有功能和消费者的迫切需求,审视一些特定房间的智能音箱的功能。
卧室
如前所述,附加功能会导致智能音箱的外形发生改变,以适应家中特定房间。例如,配备LED显示屏的扬声器看起来像闹钟,这是为了适用于卧室环境。此时,显示屏大小和分辨率并非是重要因素,因为显示屏只是外表看起来像闹钟。但是根据白天和夜晚使用时间来调整LED亮度却十分重要,这就需要添加环境光线传感器。
图3:典型的卧室闹钟式智能音箱为旧式应用添加新元素
音箱尺寸和放大器功率与较小的房间之间存在着对应比例。由于这些房间通常很安静,音箱和消费者之间的距离可能介于1到4米之间,设计人员可以相应地减少麦克风的数量和语音识别算法的复杂程度。如果音箱所在房间更加注重隐私性(如卧室),那设计人员可能就不需要为其配备视频通话摄像头了。
由于这些音箱通常放置在床头柜或书桌上,交流电源可轻松获得,因此电池电源并非是必不可少的。但是,考虑到这些音箱的位置,增加电池充电功能则具有重要意义,可以通过USB或无线方式为智能手机和智能手表充电。最后,消费者需要可以在这些位置连接并控制灯光、恒温器和安防系统。
厨房和办公室
配备平板大小的LED显示器或短距离投影显示器的大型音箱(图4)就是比较适合厨房或办公室的一个选择。此处显示屏分辨率十分重要,但空间也是机械设计中的优先考虑事项。消费者可以将配备采用TI DLP®技术的短距离投影显示器的音箱,靠着墙上或柜台下方放置,这样在墙壁或工作台面投影时,可在较小的封闭区域获得更大成像。但设计人员也需要考虑将这些音箱放置在强环境光线(如窗户)旁边的可能性,因此放置在厨房岛台或办公桌上的音箱需要配备背光LED显示器。
图4:厨房或办公室配有投影显示器的智能音箱增加了视频功能,有助于为用户营造更加身临其境的体验
如果安装在上述位置,消费者就可以用高分辨率的视频流来观看菜谱视频或电视节目,浏览新闻或看看谁在前门。这些智能音箱需要安装视频聊天用的摄像头,并能够控制光线和恒温器。
虽然厨房或办公室可能不会比卧室大,但是可能会在此来回走动或进行各种活动,或需要高保真声音,这就对音量更大的扬声器和更强劲的音频放大器提出了需求。在设计上,可能需要在麦克风数量和语音识别算法的复杂程度、缩短麦克风间的距离和更高的环境噪音量之间进行权衡利弊。
视频流和显示屏或投影的功耗使得电池工作不切实际,但是显示器较大的机身尺寸应该可以一定程度缓解散热问题。
客厅
近一个世纪以来,客厅一直是浏览多媒体新闻和进行家庭娱乐的中心。如今,客厅包括大量可与我们互动的有线和无线设备(图5)。
现在的有线或卫星机顶盒(或新兴的互联网协议电视和机顶盒)、电视、条形音箱甚至遥控器,所有这些设备都以某种方式(包括无线连接)交互。每个设备在客厅中都有特定作用,并且相互之间和谐共存。
但是,客厅里的智能音箱和添加了人工智能后的娱乐设备则改变了这一切。传统客厅设备的设计人员不得不争相添加人工智能功能和(以相对较慢的速度)家居自动化。这会造成设备的功能相互“踩踏”,给消费者带来了困惑和潜在的挫败感,这种情况在产品不共享相同的人工智能平台时格外明显。
这场围绕人工智能控制中心的争夺战掀起了音频和视频SoC、Wi-Fi 和蓝牙连接集成电路、音频集成电路、MEMS麦克风和扬声器制造商之间的竞争热潮。但是,对消费者而言,如此多的设备之间如何共存是一件难以想象的事,他们也很难知道哪台设备将处理哪条指令以及哪台设备将提供音频反馈。
长期来看,如果房间较大,放置多个带麦克风的设备并非坏事。如果布置妥当,只要设备之间能够相互通信,就可大幅提高整体波束形成和语音识别的准确性。每台设备需要协同工作,分配(并允许)单台设备与云通信,然后决定哪台设备将输出音频结果。这与其说是硬件挑战,还不如说是连通性和AI平台方面的重大挑战。这种情况需要网状网络,每台设备在网络中注册,向AI平台增添协议以决定输出音频响应和执行设计功能的设备。随着蓝牙、Wi-Fi和Zigbee协议都在发挥作用,你可以预见这是一项多么艰难的挑战。添加5G技术可能会增加混乱——但它也可能指明答案,这一点尚有待商榷。
谁将成为赢家?
电视制造商会认为,电视显然是家居控制中心的主要选择,但是电视的音频质量和扬声器数量都不如3D声音技术,无法达到消费者的期望。机顶盒同样面临相同的音频挑战。独立式智能音箱不与电视机相连接,因此它们也并不是最佳选项。而客厅里唯一能播放所有媒体的剩余设备就是条形音箱(soundbar)。
现如今出现了包括Wi-Fi机顶盒(IPTV)在内的条形音箱。消费者可在零售商店购买这些条形音箱,零售商店可为任何购买订阅服务的用户提供OTT流媒体点播视频。其他条形音箱则可以从提供电视实况转播的多系统运营商处购买。无论是何种类型的条形音箱,它们均可以集成AI语音识别系统,高保真3D音频和流媒体电视。不久,它们就可以集成家居自动化无线电和协议,例如调整暗光的Zigbee协议,以及传输安防系统或视频聊天的实时信息的摄像头。
尽管如今该自动化智能家居控制中心生态系统并非完全以这种形式存在,但它会很快来到我们的身边。这些系统的设计人员有责任始终围绕消费者的体验,开发硬件和软件来优化待放置房间的设备,并通过房间之间的无缝网状网络与其他设备之间协作。具备该功能的系统将在市场取得立足之地,并有助于市场以目前的速度增长(从2015年的100万台增加到2024年的1.65亿台,CAGR超过11%)1。而那些不具备该功能的系统将紧随3D眼镜以旧货形式来甩卖。
参考文献
2019 SAR Insight & Consulting, SensiAn Research Limited
Lo, Wenchau Albert, and Gilbert, Mike. “Smart speaker fundamentals: Weighing the many design trade-offs.” TI.com white paper Lo, Wenchau Albert, and Gilbert, Mike.“智能音箱基本知识:权衡诸多设计因素。”TI.com 白皮书
注:本文英文原文曾发表于Electronic Design