英语语音识别转文字

发表评论

A+

1、语音识别是计算语言学的跨学科子领域，利用其开发方法和技术，能够通过计算机识别和翻译口语。也被称为自动语音识别技术（ASR)，计算机语音识别或语音到文本（STT)技术。它融合了语言学、计算机科学和电气工程领域的知识和研究。

2、随着技术的发展，口音、方言、噪声等场景下的语
英语语音识别转文字插图
音识别也达到了可用状态，特别是远场语音识别已经随着智能音箱的兴起成为全球消费电子领域应用最为成
英语语音识别转文字插图(1)
功的技术之一。由于语音交互提供了更自然、更便利、更高效的沟通形式，语音必定将成为未来最主要的人机互动接
英语语音识别转文字插图(2)
口之一。

3、分倾后，语音就变成了很多小段。但波形在时域上几乎没有描述能力，因此必须将波形作变换。常见的一种
英语语音识别转文字插图(3)
变换方法是提取MFCC特征，根据人耳的生理特性，把每一帧波形变成一个多维向量，可以简单地理解为这个向量包含了这顿语音的内容信息。这个过程叫做声学特征提取。实际应用中，这一步有很多细节，声学特征也不止有MFCC这一种。

发表评论取消回复

登录 找回密码

登录找回密码