自动秒收录

AI人工智能语音特征提取


文章编号:2701 / 分类:技术教程 / 更新时间:2024-05-17 14:44:48 / 浏览:

恭喜您成为首批注册用户

这是构建语音识别器的最重要步骤,因为在将语音信号转换为频域后,我们必须将其转换为可用的特征向量形式。可以为此使用不同的特征提取技术,如MFCC,PLP,PLP-RASTA等。

在以下示例中,我们将使用MFCC技术逐步使用Python从信号中提取特征。

导入必要的软件包,如下所示-

importnumpyasnpimportmatplotlib.pyplotaspltfromscipy.ioimportwavfilefrompython_speech_featuresimportmfcc,logfbank AI人工智能语音特征提取

现在,读取存储的音频文件。它会返回两个值-采样频率和音频信号。提供存储音频文件的路径。

frequency_sampling,audio_signal=wavfile.read("/Users/admin/audio_file.wav")

请注意,在此首先抽取15000个样本进行分析。

audio_signal=audio_signal[:15000]

使用MFCC技术并执行以下命令来提取MFCC特征-

features_mfcc=mfcc(audio_signal,frequency_sampling)Python

现在,打印MFCC参数,如下所示-

print('\nMFCC:\nNumberofwindows=',features_mfcc.shape[0])print('Lengthofeachfeature=',features_mfcc.shape[1])

使用下面给出的命令绘制并可视化MFCC特征-

features_mfcc=features_mfcc.Tplt.matshow(features_mfcc)plt.title('MFCC')

在这一步中,我们使用如下滤器组特征,提取过滤器组特征-

filterbank_features=logfbank(audio_signal,frequency_sampling)

现在,打印过滤器组参数。

print('\nFilterbank:\nNumberofwindows=',filterbank_features.shape[0])print('Lengthofeachfeature=',filterbank_features.shape[1])

绘制并可视化过滤器组特征。

filterbank_features=filterbank_features.Tplt.matshow(filterbank_features)plt.title('Filterbank')plt.show()

根据上述步骤,您可以观察到以下输出:图1为MFCC,图2为过滤器组。

违法和不良信息举报电话:173-0602-2364|


相关标签: AI人工智能语音特征提取

本文地址:https://www.badfl.com/article/b36c850ba015cdc99c57.html

上一篇:AI人工智能口语词的识别...
下一篇:AI人工智能生成单调音频信号...

发表评论

温馨提示

做上本站友情链接,在您站上点击一次,即可自动收录并自动排在本站第一位!
<a href="https://www.badfl.com/" target="_blank">自动秒收录</a>