执行命令提取mfcc后返回的是什么?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了执行命令提取mfcc后返回的是什么?相关的知识,希望对你有一定的参考价值。
我一直在学习声音分析,我在其中遇到了术语mfcc.所以当我执行命令提取mfcc后,返回的是什么?librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=40)
我得到的numpy数组形状为40乘216.所以我得到的是我已经提取了40个特征在216个帧.但这里到底是什么意思帧,它是类似于采样率和我们在加载音频文件时定义它。
答案
什么不是马上就能看出来的呢?《多边基金公约》文件 是,它叫 librosa.feature.melspectrogram. 内部。而且 melspectrogram
有参数 win_length
n_fft
和 hop_length
,它们定义了一个 框. 你也可以将这些参数传递给 mfcc
.
那么什么是帧呢?基本上,它是处理一堆原始样本的结果。假设窗口长度为2048个样本(这是默认值),跳长为512(也是默认值),每一个由 mfcc
对应于2048个原始样本,是512个样本 "进一步的音频 "比它的前身。换句话说,帧之间有明显的重叠。
举个例子,要为你的音频创建mfcc,定义一帧为1024个样本,跳长为512,你可以调用。
librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=40, hop_length=512, n_fft=1024)
同样的,如果你没有明确的传递这些参数,那么默认的是: 谱图 被使用。
以上是关于执行命令提取mfcc后返回的是什么?的主要内容,如果未能解决你的问题,请参考以下文章