对于这个问题,目前的主要解决方法是语音识别和麦克风阵列相结合。通过阵列信号处理技术,增强多通道语音技术,而后利用深度学习的方法进行声学建模。当然,这种方案有待于进步和优化,并且要考虑多方面的问题。如怎样将阵列信号处理技术和深度学习方法相结合,利用阵列信号处理的相关知识指导深度神经网络的结构设计,以便直接从多通道语音信号中学习多通道语音增强方法,而后和后端声学模型联合优化等。 另外,个体发音以及用词习惯都存在差异性,所以如何使得语音识别更加智能化也是一个问题。 可以看到,语音识别已经走到一个相对成熟的发展阶段,未来也会在应用级市场普及,但在发展过程中仍然存在许多瓶颈。生物技术识别方式先进而便捷,但人们不免担心其中所涉及到的隐私问题。
|