执行命令提取mfcc后返回的是什么?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了执行命令提取mfcc后返回的是什么?相关的知识,希望对你有一定的参考价值。

我一直在学习声音分析,我在其中遇到了术语mfcc.所以当我执行命令提取mfcc后,返回的是什么?librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=40) 我得到的numpy数组形状为40乘216.所以我得到的是我已经提取了40个特征在216个帧.但这里到底是什么意思帧,它是类似于采样率和我们在加载音频文件时定义它。

答案

什么不是马上就能看出来的呢?《多边基金公约》文件 是,它叫 librosa.feature.melspectrogram. 内部。而且 melspectrogram 有参数 win_lengthn_ffthop_length,它们定义了一个 . 你也可以将这些参数传递给 mfcc.

那么什么是帧呢?基本上,它是处理一堆原始样本的结果。假设窗口长度为2048个样本(这是默认值),跳长为512(也是默认值),每一个由 mfcc 对应于2048个原始样本,是512个样本 "进一步的音频 "比它的前身。换句话说,帧之间有明显的重叠。

举个例子,要为你的音频创建mfcc,定义一帧为1024个样本,跳长为512,你可以调用。

librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=40, hop_length=512, n_fft=1024)

同样的,如果你没有明确的传递这些参数,那么默认的是: 谱图 被使用。

以上是关于执行命令提取mfcc后返回的是什么?的主要内容,如果未能解决你的问题,请参考以下文章

Librosa MFCC 特征提取

整首歌的 mfcc 与为同一首歌的片段计算的 mfcc 不同

如何合并 MFCC

如何在 Java 中提取 MFCC 特征

浅谈MFCC

片段视图返回后执行的 Firebase 查询