近几年,计算音频技术不断迭代创新。
一方面,以TWS耳机为代表的可穿戴音频设备使用场景越发多样。除了通话之外,远程办公、直播、音视频内容制作等兴起,使得麦克风功能使用场景大大拓展;具备主动降噪功能(ANC)的耳机普及,使用户能够自主控制环境噪声,这样的情况下如何优化使用体验、避免反复摘戴都成为使用场景带来的挑战。
另一方面是佩戴挑战。设备体积越来越小,无法像头戴式耳机那样拥有充足空间用来设计避风结构,因此麦克风频繁暴露于风的湍流干扰下,影响主动降噪效果、透传体验、以及用于语音通话识别的效果。此外,佩戴条件的变化和个性化佩戴方式,都会影响聆听体验。来自于场景和佩戴的多种挑战,导致设备搭载的音频功能日益复杂化,耳机不仅要播放内容,还需要拾取声音,对声音指令做出迅速反应,并对环境进行检测,进行信号处理。
声加科技一直专注于通信声学核心技术,并致力于解决端侧设备面临的技术挑战,不断创新和突围,并形成了多种方案。目前多家知名企业TWS(真无线)蓝牙耳机均采取了声加科技的TWS耳机方案,在复杂场景下为人与人通信、人与机器交互提供更清晰、更舒适、更自由的使用体验。
SKWS关键词唤醒
声加科技SKWS(Soundplus Keyword Spotting)系列多命令词/关键词唤醒方案,能够可靠地检测声音信号中的语音命令。该技术基于Always-on一直缓存talk mic的数据,进行特征提取;灵敏度水平可调,确保在存在背景噪声和其他非语音的情况下,将误报检测降至最低。
SNKWS方案可选语音加速度计常开,用于进行准确的VAD以及说话人确认,降低待机功耗和误识别率。当用户通过说出关键词,可以将麦克风阵列从休眠状态唤醒。目前支持多命令词并行识别与定制功能,具有低于500毫秒的机器应答响应的极致速度。
SNKWS可以单独使用,也可以与SVE语音增强以及SAE主动增强集成,以获得完整的TWS耳机的解决方案。
-
01
语音激活检测 Voice Activity Detection(VAD)
当VAD成功检测到语音信号,才会把麦克风阵列从休眠状态唤醒,从而在低待机功率下启用Always-on的语音检测。VAD模块支持多种输入组合方式,利用阵列算法、神经网络算法对佩戴者的语音端点进行检测,支持嘈杂环境以及播放音乐等各个工况条件。
-
02
自适应波束形成 Adaptive Beamforming
使用波束形成的麦克风阵列可检测出目标语音方向,增强目标语音并抑制环境噪声。
-
03
回声消除 Acoustic Echo Canceller (AEC)
多频段残余回声消除器消除回声,确保全双工通信。单声道或立体声回声消除器允许在播放音乐时响应用户的声音。
-
04
噪声抑制 Noise Reduction
检测并降低稳态和瞬态噪声。
-
01
根据使用场景和麦克风数量,灵活调整配置实现最佳语音识别效果
-
02
耳机唤醒语音助手功能,切换歌曲功能、音量调整
-
03
计算资源小,功耗低
-
04
高性能,抗噪声干扰