中文
中文  /   English

AI通话降噪硬核来袭 声加科技AI双麦方案赋能OPPO Enco Free耳机

2019-12-25 453 发布:admin

12月20日,OPPO年度重磅音频类产品OPPO Enco Free真无线耳机媒体沟通会在北京举行。官方宣称,该耳机是承载了OPPO声学基因和技术沉淀的又一力作,不仅具备高音质、低延迟的卖点,同时采用了业内先进的通话降噪AI算法技术。在硬件上,则使用了双麦克风波束成形,通过软硬协同对噪音进行屏蔽处理。其中,通过机器深度学习技术,AI算法通过对常见噪声的功率图谱分析,自动识别并分离噪声和人声,就算面临嘈杂的环境,对方也能听清通话内容,轻松自如交谈。


OPPO耳机1.png

OPPO官网发布的OPPO Enco Free耳机


近一两年,随着与智能手机协同使用的场景不断增多,消费者越来越关注TWS耳机的通话质量。作为用户的网友们甚至发声:耳机音质好已经是标配,无线通话降噪才是真本事!在生活里多样的通话场景中,往往充斥着各种嘈杂的噪声,如何给用户提供一个高质量的通话,成为了各大TWS耳机厂商面临的攻坚课题。

 

OPPO Enco Free真无线耳机就采用了智能听觉领域的创新公司——声加科技的SVE AI双麦降噪技术,是在传统双麦降噪的基础之上加入了深度神经网络,通过深度神经网络与双麦克风波束成形技术的强强结合,把业界非常棘手的尖锐噪音抑制的更加干净,例如现实生活中频繁刺耳的敲击声、地铁进站的刹车声、工地噪声、汽笛声等,使得OPPO Enco Free通话降噪水平达到了令人振奋的新高度。

SVE AI双麦降噪VS 双麦降噪

目前基于传统信号处理的两麦阵列方案,是通过波束成形的原理让麦克风拾取指定方向的目标语音信号,然后利用其空间信息削弱非语音方向的干扰噪声。这种方案对于尖锐的高频噪音的处理效果始终不尽人意。

 

为了使用户在各种噪声环境下都可以轻松畅聊,声加科技潜心研发了SVE AI双麦降噪方案。此方案融合了双麦降噪与深度神经网络降噪模型,在训练集加入不同场景的噪声,通过深度神经网络进行语音增强,把尖锐的高频噪声抑制得更干净。

创新赋能:双麦降噪+深度神经网络

得益于团队成员在通信声学核心技术上十五年的经验积累,声加科技创新性地开发了SVE AI双麦降噪技术,充分利用了麦克风信号的时域、频域、空间域以及样本空间中的统计信息的差异性进行语音增强,为通信终端提供高品质的语音信号。

 

在算法开发阶段,声加科技发现,单纯利用深度神经网络进行语音增强的方案存在局限性。对比手机、平板等高运算力设备,TWS耳机这类可穿戴设备受限于极其有限的电池与运算能力弱的蓝牙芯片,深度神经网络模型也做的比较小,导致泛化能力不足。然而现实中的噪声环境是极其复杂的, 一旦在复杂声学场景下算法运算失效,会出现吃语音,再混进周围干扰语音,背景噪声起伏等问题,让语音可懂度急剧下降,严重影响用户的语音通话。

 

为了解决上述问题,声加科技在双麦降噪基础上,融合了深度神经网络,补充了声波的空间信息,还利用深度神经网络对高频噪声作为训练集,把对语音通话的干扰抑制的更干净。在将二者的优点融合,短板互补后,使得算法对于任何环境均保证稳定而一致的性能。不仅通话品质通过了严格的测试,表现优异,其稳定而深度的降噪效果在主观体验上也得到了OPPO的青睐。

 

专注通信声学核心技术 提供全场景语音交互技术方案


声加科技是依托于中科院声学所雄厚的人才和科研资源,打造产学研一体化的创新型创业公司。团队专注于通信声学核心技术,为B端客户提供复杂场景下的近场、中场、远场语音交互技术方案,以及从芯片、模组、PCBA到工业设计的一站式产品方案凭借在声学和语音领域的十余年的技术积累,其回声抵消、噪声抑制、声源定位、混响消除、波束形成、语音唤醒等核心技术在行业内一直处于领先水平。


在TWS耳机领域,声加科技目前已完成了单麦通话降噪、双麦通话降噪、三麦通话降噪、双麦+AI通话降噪、FBmic+双麦的多传感器融合方案、低功耗关键词唤醒/有限命令词方案等多个方案的应用落地。应用产品除了本次发布的OPPO ENCO FREE,还有华为、小米、万魔等的多款明星产品。


最后,声加科技表示,未来还将为客户提供模组、芯片等多种形态的产品,为人与人通信、人与机器交互提供更清晰、更舒适、更自由的使用体验,最终实现人机完全交融的愿景。


SVE AI 开启前后对比(地铁场景):


语谱图对比.png

点击下方音频文件,马上感受声加科技SVE AI 强大功能: