中文
中文  /   English

获数千万元Pre-A轮融资 声加科技要解决复杂场景下的“语音交互”

2020-01-15 293 发布:admin

近日,智能听觉领域的创新公司——声加科技对外宣布,其已于2019年11月完成数千万元的Pre-A轮融资,由厦门半导体投资集团领投、搜狗跟投。这也是声加科技继中科创星和万魔声学后又斩获的两大知名资本,将主要用于声学算法的持续迭代、部分技术的授权,以及开拓新市场、优化商业模式等,实现为客户提供模组、整体系统等多样形态的产品和服务。

image.png

声加科技CEO邱锋海


厦门半导体表示,智能语音市场增长潜力巨大,但现有声学技术的商业应用仍然处于初级阶段,主要涉及物理声学等基础学科的声学技术,其中的语音前端处理便是实现语音交互的瓶颈之一。而要解决语音前端的诸多问题,需要像声加科技这样具有多年声学前端处理技术积累的团队,不断改善算法从而提升语音信号处理质量,进而提高各种环境下的语音识别率。声加的技术均为自行研发,其能提供全场景的前端语音处理方案,包括近场到远场语音增强、语音唤醒、语音命令词识别等全系列算法、模组解决方案,团队技术实力强劲。

 

 另一位投资方搜狗则表示,本次投资声加看重的就是声加在声学和语音领域十余年的技术积累,其成熟领先的通信声学核心技术以及复杂场景下的软硬件降噪技术能够有效帮助搜狗提升智能语音硬件的远场交互体验,进一步巩固搜狗智能语音产品在行业的领先位置。

 

声加科技是一家专注于通信声学核心技术的创业公司,致力于在复杂场景下,为人与人通信、人与机器交互提供更清晰、更舒适、更自由的使用体验,最终实现人机完全交融的愿景。

 

随着智能手机与平板电脑的长足发展,我国智能终端产业已形成高度成熟的供应链。在家电的语音控制应用开始爬升、智能音箱被看作是家庭端的流量入口后,真正做到无线化的TWS耳机,因为集通话、健身追踪、语音助理等功能于一体,并得益于与手机协同使用的场景,被寄予“万物互联”交互入口的期望,已逐渐成为当前市场的最强热点。权威报告显示,TWS耳机不仅保持着高度增长的市场规模,国内市场更是因为华为、小米、OPPO等手机厂商的参与,显得多元又创新。

 

据声加科技CEO邱锋海介绍,在经历了技术探索和市场启动两个阶段后,以真无线耳机为代表的智能语音产品,正在给人们带来更好的交互体验并改变着用户的习惯。智能语音产品主要有前端语音处理、语音识别、语音合成和自然语言处理四个技术环节。其中,作为流程第一步的声学前端处理,相当于扮演者人类“耳朵”的角色。 


image.png

声加科技的核心技术及应用场景


2018年年初,依托于中科院声学所人才和科研资源成立的声加科技,凭借团队十余年的技术积累,在近、中、远场的语音交互上,都做了技术研发和市场实践。产品形态包括提供领先的复杂场景下的“端”上的语音处理方案与及技术,以及从芯片、模组、PCBA到工业设计的一站式产品方案。

 

其中,在近场语音交互场景中,声加科技根据其语音信号模型,成功研发包括SVE AI单麦、双麦通话降噪方案、FBmic+双麦通话降噪方案、双麦+骨导(VPU)降噪方案、AI+双麦通话降噪方案、耳机多麦克阵列通话降噪方案、小资源关键词唤醒(KWS)有限语音命令方案等。

 

在远场语音交互场景中,以智能音箱为代表,要面对回声、混响、动态范围的挑战。声加科技可以实现360度全方位唤醒、回声抵消、混响抑制、声源定位、定向拾音、噪声抑制、精准识别及唤醒、动态范围控制等,可满足复杂场景5米距离的语音交互需求。其远场拾音解决方案还可广泛应用在智能穿戴产品、笔记本、电脑、智能车载、智能能家居智能玩具、机器人等多种产品。

 

目前已落地的应用产品包括OPPO Free ENCO真无线耳机、华为FreeBuds悦享版TWS耳机、荣耀Flypods青春版TWS耳机、小米Air系列TWS耳机、小米户外蓝牙音箱、万魔EM001耳机、万魔EM004耳机、京东京鱼座TWS耳机等。终端授权设备总数近400万套。2020年计划研发更低功耗的2MIC麦克风阵列芯片和模组,并将市场扩大到工业、医疗、教育等场景。

image.png

声加科技部分产品展示


过去几十年里,国内音频消费市场的需求长期处于两极分化的状态:一个极端是极度发烧,另一个极端是只要声音够响、能听懂。然而,2014年11月,亚马逊的Echo智能音箱横空出世,声学和AI的结合让很多高性能的声学算法需要分别在终端和云端实现并优化,高指标的需求让声学从“隐学”几乎变成了“显学”。随后也引发了包括智能音箱、真无线智能耳机等音频产品的火爆,声学应用变得如火如荼。

 

“尽管目前各家都宣称,语音识别的正确率高达95%以上,但这项数据是建立在实验环境之下,而现实中的对话/通话环境往往是复杂而多变的。比如在嘈杂的咖啡厅,高速行驶的地铁里,移动中的声源等等。这就要求声学前端处理技术不断改善,实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪、阵列增益等功能,提升语音信号处理质量,进而提高各种环境下的语音识别率。这也是声加团队要致力突破的方向。”邱锋海表示。