AI人工智能语音特征提取

文章编号：2701 / 分类：技术教程 / 更新时间：2024-05-17 14:44:48 / 浏览：次

恭喜您成为首批注册用户

这是构建语音识别器的最重要步骤，因为在将语音信号转换为频域后，我们必须将其转换为可用的特征向量形式。可以为此使用不同的特征提取技术，如MFCC，PLP，PLP-RASTA等。

在以下示例中，我们将使用MFCC技术逐步使用Python从信号中提取特征。

导入必要的软件包，如下所示-

importnumpyasnpimportmatplotlib.pyplotaspltfromscipy.ioimportwavfilefrompython_speech_featuresimportmfcc,logfbank AI人工智能语音特征提取

现在，读取存储的音频文件。它会返回两个值-采样频率和音频信号。提供存储音频文件的路径。

frequency_sampling,audio_signal=wavfile.read("/Users/admin/audio_file.wav")

请注意，在此首先抽取15000个样本进行分析。

audio_signal=audio_signal[:15000]

使用MFCC技术并执行以下命令来提取MFCC特征-

features_mfcc=mfcc(audio_signal,frequency_sampling)Python

现在，打印MFCC参数，如下所示-

print('\nMFCC:\nNumberofwindows=',features_mfcc.shape[0])print('Lengthofeachfeature=',features_mfcc.shape[1])

使用下面给出的命令绘制并可视化MFCC特征-

features_mfcc=features_mfcc.Tplt.matshow(features_mfcc)plt.title('MFCC')

在这一步中，我们使用如下滤器组特征，提取过滤器组特征-

filterbank_features=logfbank(audio_signal,frequency_sampling)

现在，打印过滤器组参数。

print('\nFilterbank:\nNumberofwindows=',filterbank_features.shape[0])print('Lengthofeachfeature=',filterbank_features.shape[1])

绘制并可视化过滤器组特征。

filterbank_features=filterbank_features.Tplt.matshow(filterbank_features)plt.title('Filterbank')plt.show()

根据上述步骤，您可以观察到以下输出:图1为MFCC，图2为过滤器组。

违法和不良信息举报电话：173-0602-2364|

相关标签： AI人工智能语音特征提取、

本文地址：https://www.badfl.com/article/b36c850ba015cdc99c57.html

做上本站友情链接,在您站上点击一次,即可自动收录并自动排在本站第一位！
<a href="https://www.badfl.com/" target="_blank">自动秒收录</a>

最新资讯