提供全场景的语音前端处理方案,「声加科技」获数千万元Pre-A轮融资

2020-01-13
来源:36氪 作者:36氪
通过麦克风阵列实现复杂噪声环境下的拾音,主要面向耳机市场。

语音交互技术研发服务商声加科技近期获得数千万元Pre-A轮融资,由厦门半导体投资集团领投、搜狗跟投,本轮融资将主要用于语音处理技术迭代以及市场推广。公司曾于2018年获得由中科创星、万魔声学投资的近2千万元天使轮融资。


智能语音市场增长潜力巨大,其中典型代表就是个人智能音频设备和家居领域智能音箱。TWS耳机、无线入耳式耳机和无线头戴式耳机是个人智能音频设备的三大类。Canalys报告显示,2019年全球个人音频设备出货量接近3.5亿台;智能音箱的全球出货量也接近2亿台。在市场需求方面,消费者已经向听觉享受的方向转变,并且人工智能对于语音交互的质量要求也越来越高,但是现有声学技术的商业应用仍然处于初级阶段,声学技术中的语音前端处理便是实现语音交互的瓶颈之一。


声加科技成立于2018年1月,是一家司专注于通信声学核心技术,为行业用户提供复杂场景下的“端”上的近场、中场、远场语音处理方案与及技术。针对目前语音交互过程中面临四大主要问题:对话有效距离受限;唤醒设备要求周围环境要安静,否则设备难以识别指令;交互过程中对发音准确度要求,用方言难以沟通;设备的持续通话能力有限。


声加科技的核心技术在于通过麦克风阵列实现复杂噪声环境下的拾音,并且构建了五大算法模块——回声消除、混响消除、声源定位、波束形成、噪声抑制、关键词唤醒,使语音交互即使在较远距离中也能完成,并且降噪能力很强,对话时不需要保持非常安静的环境。


目前公司的解决方案主要用在耳机上,与各大手机厂商合作;同时也为智能穿戴、智能车载、智能家居、智能玩具等提供前端拾音解决方案。声加科技CEO邱锋海告诉36氪,公司2018年完成了核心算法的搭建;2019年重点完成复杂场景下的多麦克风阵列芯片和模组的定义及场景化,主要通过软件的形式为智能终端产品提供服务;2020年计划研发更低功耗的2MIC麦克风阵列芯片和模组,并将市场扩大到工业、医疗、教育等场景。


11121321.jpg


从技术路径上看,目前主要涉及到用户端的解决方案的创业公司有声智科技和大象声科。声智科技是专注于家居场景下,从端到云之间的解决方案;而声加科技则是专注于全场景的语音前端处理方案。此外,同样将多麦降噪设计应用到耳机上的大象声科,其解决方案是基于深度神经网络,经大量数据训练,训练出的模型可覆盖各种噪声场景;声加科技则是将深度神经网络与基于物理的技术结合起来,是模型覆盖的噪声场景够广泛的前提下保证良好的语音效果。


声加科技研发人员主要来自于中科院声学所、清华大学、南京大学和中国科学技术大学等科研院所,80%是声学专业和信号处理专业科班出身的硕士、博士,,拥有底层技术和算法的长期积累。公司目前营收主要来自为客户提供授权收取license费用,2019年营收约900万元。


关于资方观点,厦门半导体表示:PE/VC">投资声加科技是投资于一个在语音解决方案领域有重要意义的产业链环节。在语音行业整个产业生态圈内,声加是基础技术提供商,厦门半导体投资集团投资声加,将促进声加与产业链上下游企业的深入合作,产生良好的协同效应。


搜狗表示:搜狗一直强化以语言为核心的AI技术研发和积累,并支持AI硬件产品,通过录音笔、翻译机等硬件品类切入到智能语音市场领域,持续带来创新领先的语音交互体验。本次投资声加看重的就是声加在声学和语音领域十余年的技术积累,其成熟领先的通信声学核心技术以及复杂场景下的软硬件降噪技术能够有效帮助搜狗提升智能语音硬件的远场交互体验,进一步巩固搜狗智能语音产品在行业的领先位置。


第一时间获取股权投资行业新鲜资讯和深度商业分析,请在微信中搜索“融中财经”公众号,或者用手机扫描左侧二维码,即可获得融中财经每日精华内容推送。

融中 热门

您可能也喜欢的文章