应用声学

天猫精灵今天推出 Sound 系列,沉淀四年的智能声

 

3、环境感知的自适应能力。近耳、定向、空间检测等技术持续提升,以近耳技术为例,目前TWS耳机降噪成为标配功能,但部分人佩戴时间过长会产生不适,通过局域声场控制等方式在不佩戴耳机做降噪成为未来探索方向。

这一步考验的是大数据分析能力,后台根据用户的历史行为来推测当前用户的需求,比如用户习惯早上7点半起床后听5分钟歌,再听新闻,天猫精灵后台算法自动检测到用户的生活规律,在播放万5分钟歌曲之后,会自动提示用户,是否继续放新闻。

首先,音量大也意味着扬声器功率很大,使得扬声器的非线性增加,这直接导致唤醒困难,“调大音量后,扯着嗓子喊,音箱没反应”也是绝大多数音箱存在的问题。

这并非一体腔技术首次露面,智能一体腔诞生始于方糖,当初其99元的高性价比,覆盖极广的用户范围,随之而来的是极广的音乐品类,这意味方糖需要做到满足各个频段的音乐类型播放,且不损害声音,同时兼顾成本。这是一个极具挑战性的尝试,为此天猫精灵在产品设计之初就将关乎听觉享受度、清晰度的极致低音考虑在内。

声源定位上,传统获取声音的方式其实是声学检测,而非人声检测,声学模式下噪声只能有一个方向。天猫精灵意识到这个本质问题,增加了唤醒词信息,如唤醒词的边界、唤醒词上每个频点人声的比例,将语音特征与声学特征结合,提高最终的寻向准确率。

在华为、小米以联名海外品牌发新之后,国内一度没有再次进攻高端智能音箱的企业。

天猫精灵一直致力于打造不包浆的均衡器,还原音乐本质的情感表达。

以实验室负责人汪涛为例,13年声学行业从业经历,曾在哈曼、Tymphany、先歌国际等一线音频公司任职,参与过Harman/Kardon、JBL等口碑爆款音箱的声学设计工作。

其次,每一首歌的默认音量不同,当扬声器功率大的背景下,音量的不一致会被放大,于是,上一首歌的音量,放到下一首时,音量要么突然变大,要么突然变小,用户要么随时随地调整音量设置,要么忍受大小不一的音量,听歌体验非常糟糕。

空间感上,360 度环绕设计,在摆放位置上的影响降到了最小。音质表现到位,内容资源非常多,市面主流音乐平台内容都有,另外还有电台、有声内容和以及儿童学习资源等。

第三步服务表征是交互方式的延展,基于对用户和场景的综合理解,自动推荐最优服务给客户。根据用户是何种音乐平台的高级会员,自动推荐该平台的高品质音乐。

音乐响起的瞬间,鼓点具有让人精神抖擞的质感,震撼而宽厚,中低频时,声音错落有致,张力十足,当音乐在急促与舒缓间流动时,过渡平缓自然。曲毕,鼓声的澎湃与恢弘犹在耳边,临场感非常强。

所以低频是一栋房子的地基,地基不好,房子修得再高也是无用功。不夸张地说,低频决定了整个音频的基调和节奏,是支柱般的存在。

与高频相比,人脑对低频并不敏感,但生活中大多数声音都处于中低频。

如何让各个频率的声音都恰如其分地表达,从而达到整体和谐,就需要均衡器出马。

针对大声量场景,猫耳算法能让音箱即使处于最大音量播放歌曲时,用户只需要用正常音量就能够轻松唤醒。同时,天猫精灵还针对不同音量的歌曲,增加自适应环节。再来谈谈回声消除。传统的回声消除算法,主要通过线性滤波器,去掉音箱本身的线性回声。

所以理想的频率响应应为20Hz~20KHz,这样就能完全呈现全部音频,但现实上几乎不可实现。一般的扬声器频率响应在100Hz-120KHz,这意味着大多数的扬声器都存在低频缺失。

小米以499元的价格,开了一个好头,但并不完美,尽管音质上有一定提升,为了平衡高端和价格,不可避免会出现为了节省成本,在音质上有所牺牲,只能是入门级的高端智能音箱。

即将发布的高端智能音箱,音质好、音量大,对语音交互的要求也更高。场景识别引擎解决了鸡尾酒会问题,猫耳算法大刀阔斧地向回声消除、声源定位和降噪进发。

第一个需要对付的,是唤醒困难。

进入天猫精灵声学实验室的一项硬指标,所有人都需要经过金耳朵认证。这个已建设4年的实验室,在全球范围内有20多个声学实验场地,拥有数十项智能声学相关专利。

但另一方面,太大容积率会强行拉大低频下潜深度,减少扬声器的中低频量感,从而使低音有气无力,变薄,此外,材料成本和运输成本也会更高。