我可以尝试从 mp3 文件中提取哪些特征来对它们进行分类?
Posted
技术标签:
【中文标题】我可以尝试从 mp3 文件中提取哪些特征来对它们进行分类?【英文标题】:Which features can I try to extract out of mp3 files to classify them? 【发布时间】:2017-02-13 01:50:07 【问题描述】:我计划构建一个处理 mp3 文件的音乐流派分类器,我想测试一下哪些功能最适合这个。我看过一篇使用 MFCC(梅尔频率倒谱系数)的论文,但作为机器学习的初学者,这种方法感觉很复杂。我还看到一些将 mp3 文件转换为频谱图并对其进行分析,但没有成功。我正在寻找的是一些易于提取的功能来对 mp3 文件进行分类。除了我刚刚列出的两种方法之外,还有其他方法吗?
【问题讨论】:
如果你想要“简单”,只需将“流派”字段从 ID3 标签中拉出... 我正在分析的文件不包含流派字段中的任何数据。 【参考方案1】:这方面有一些论文,你可以很容易地用谷歌搜索它们。
但最简单的特征是节拍速度、高/低频比例等。
所有这些都可以使用 FFT(快速傅里叶变换)提取。但是如果你以前没有做过,恐怕这可能不是那么容易......
【讨论】:
以上是关于我可以尝试从 mp3 文件中提取哪些特征来对它们进行分类?的主要内容,如果未能解决你的问题,请参考以下文章
TagLib - 从 MP3 中提取专辑封面 (Powershell)