中文
中文  /   English

声加科技携语音前端解决方案亮相“2018西安全球硬科技产业博览会”

2018-11-12 232 发布:admin


11月8日,以“硬科技发展西安,硬科技改变世界,硬科技决胜未来”为主题的“2018西安全球硬科技产业博览会”在西安市曲江会展中心隆重开幕,并于当日上午九点正式对外开放。作为2018全球硬科技创新暨“一带一路”创新合作大会人气最高、最受关注的活动之一,将持续至11日的博览会上有近300家企业参展,预计总参展人数超过8000人。

展会1.jpg

2018西安全球硬科技产业博览会现场

 

据悉,本届博览会展览总面积达2万平方米,共设置中国科学院、国防科工、军民融合、硬科技“八路军”(光电芯片、信息技术、生物技术、人工智能、智能制造、航空航天、新能源、新材料)等15个主题展区,参展单位包括硬科技领域相关的国际企业,硬科技国内知名企业、独角兽企业,大型集团企业,中科院系统、国防科工系统,西安市各开发区、重点高校院所、硬科技龙头骨干企业,以及20个国内城市和5个国外友好城市代表团,集中展示硬科技“八路军”产业发展代表性企业及成就为重点的国内外硬科技领域前沿新技术、新产品。

其中,来自中科院声学所、专注于声学前沿技术和语音交互的科技创新公司——声加科技,携其多麦克风远场拾音解决方案,包括高性能6麦克风阵列模组以及低功耗3麦克风阵列模组,亮相博览会中科院主题展区。虽然展会现场的噪音环境非常嘈杂,广播、人声、混响、回声等干扰源使得现场的平均噪音在80dB左右,但是声加所展示的拾音模组仍然在3米的距离可以很容易的被唤醒,吸引了一大批参展观众前来互动,现场同时展示了声加科技的近场拾音方案代表作品之一蓝牙耳机语音增强算法的原理以及应用。

展会2.jpg

声加科技市场总监冯颖秋为物联网企业高管讲解产品

 

作为硬科技的代表性企业,成立于今年1月的声加科技是一家致力于解决全场景下的语音前端处理技术型新兴创企。其专注于通信声学核心技术,依托中科院声学所雄厚的人才和科研资源,以产学研一体化为全场景用户提供软硬一体化的语音前端拾音解决方案,包括麦克风阵列的算法、模组以及麦克风阵列,关键词唤醒(KWS)以及唤醒词定制训练模型。并可提供产品设计等定制化方案以帮助用户加速产品上市。

据其CEO邱锋海介绍,从上世纪50年代,语音识别从单一模式匹配到70年代的模式和特征分析,再到90年的统计方法(HMM+GMM),直到2010年后,深度神经网络(DNN)取得了巨大的成功,基于DNN技术的应用也呈爆炸式增长。同时,语音识别、自然语言理解、语音合成性能等技术大幅提升,互联网、移动互联网的高速发展也为算法引擎提供了大量的数据“粮食”。在海量的数据红利下,云端计算软硬件系统的算力增长使其能够快速处理海量数据,再加上边缘计算的能力增强、功耗降低等因素,语音交互的“基础设施”已逐渐成熟。因此,智能语音交互应用的兴起也就顺理成章。

随着巨头们对智能音箱和智能耳机的不断投入,智能语音产品已经越来越被人们熟知。作为智能听觉的引领者和创新者,声加科技主要团队来自于中科院声学所、清华大学、南京大学和中国科学技术大学等国内一流科研院所。核心团队成员亦大多师出中科院声学所,平均在业界拥有超过十五年工作经验,博士以上学历人员占比80%以上。核心技术包括回声消除ACE(支持单声道和立体声回声消除)、混响抑制(去除房间混响导致的语音拖尾)、声源定位(利用麦克风阵列,实现360度全方位语音信号采集,并通过声源定位来确定目标说话人的方向)、定向拾音(在保护主方向语音的同时,去除环境中的语音、电视噪声等非平稳干扰)、噪声抑制(去除空调、胎噪等平稳噪声以及环境z红的语音、电视等非平稳噪声的波束成形算法)、关键词唤醒KWS(支持Dual-wake、Free-out、One-shot等独有的定制功能,同时支持多轮对话功能)。

展会 3.jpg

声加科技展出展品

 

目前,声加科技可为B端客户提供复杂场景下的近场、中场、远场语音交互技术方案,以及从芯片、模组、PCBA到工业涉及的一站式产品方案。邱锋海表示,10万年前,语言的出现大大加速了人类社会进化和发展的进程。时至今日,听和说依然是人类最基本、最常用和最灵活的交流方式,同时也是最好的人机交互方式。在经历了计算机命令式交互到图形界面触摸交互,再到信息时代/高级信息时代的自然交互、和情感交互……毫无疑问,语音交互将会成为泛在的人机交互方式。声加科技将一如既往的致力于在复杂声场景下,为人与人通信、人与机器交互提供更清晰、更舒适、更自由的使用体验,最终实现人机完全交融的愿景。