执行命令提取mfcc后返回的是什么？

Posted 2021-03-19

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了执行命令提取mfcc后返回的是什么？相关的知识，希望对你有一定的参考价值。

我一直在学习声音分析，我在其中遇到了术语mfcc.所以当我执行命令提取mfcc后，返回的是什么？librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=40) 我得到的numpy数组形状为40乘216.所以我得到的是我已经提取了40个特征在216个帧.但这里到底是什么意思帧，它是类似于采样率和我们在加载音频文件时定义它。

答案

什么不是马上就能看出来的呢？《多边基金公约》文件是，它叫 librosa.feature.melspectrogram. 内部。而且 melspectrogram 有参数 win_lengthn_fft 和 hop_length，它们定义了一个框. 你也可以将这些参数传递给 mfcc.

那么什么是帧呢？基本上，它是处理一堆原始样本的结果。假设窗口长度为2048个样本（这是默认值），跳长为512（也是默认值），每一个由 mfcc 对应于2048个原始样本，是512个样本 "进一步的音频 "比它的前身。换句话说，帧之间有明显的重叠。

举个例子，要为你的音频创建mfcc，定义一帧为1024个样本，跳长为512，你可以调用。

librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=40, hop_length=512, n_fft=1024)

同样的，如果你没有明确的传递这些参数，那么默认的是：谱图被使用。

以上是关于执行命令提取mfcc后返回的是什么？的主要内容，如果未能解决你的问题，请参考以下文章

Librosa MFCC 特征提取

整首歌的 mfcc 与为同一首歌的片段计算的 mfcc 不同

如何合并 MFCC

如何在 Java 中提取 MFCC 特征

浅谈MFCC

片段视图返回后执行的 Firebase 查询