音频特征提取
Posted rsapaper
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了音频特征提取相关的知识,希望对你有一定的参考价值。
音频特征提取——librosa工具包使用 - 桂。 - 博客园 https://www.cnblogs.com/xingshansi/p/6816308.html
采样频率,也称为采样速度或者采样率,定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数是采样周期或者叫作采样时间,它是采样之间的时间间隔。通俗的讲采样频率是指计算机每秒钟采集多少个信号样本。
www.baike.com/wiki/采样频率
音频
在数字音频领域,常用的采样率有:
8,000 Hz - 电话所用采样率, 对于人的说话已经足够。
11,025 Hz。
22,050 Hz - 无线电广播所用采样率。
32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率。
44,100 Hz - 音频CD, 也常用于MPEG-1 音频(VCD, SVCD, MP3)所用采样率。
47,250 Hz - Nippon Columbia (Denon)开发的世界上第一个商用 PCM 录音机所用采样率。
48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率。
50,000 Hz - 二十世纪七十年代后期出现的3M 和Soundstream 开发的第一款商用数字录音机所用采样率。
50,400 Hz - 三菱 X-80 数字录音机所用所用采样率。
96,000 或者 192,000 Hz - DVD-Audio、一些 LPCM DVD 音轨、BD-ROM(蓝光盘)音轨、和 HD-DVD (高清晰度 DVD)音轨所用所用采样率。
2.8224 MHz - SACD、索尼和飞利浦联合开发的称为Direct Stream Digital的1位sigma-delta modulation 过程所用采样率。
总之当前声卡常用的采样频率一般为44.1KHz(每秒采集声音样本44.1千次)11KHz、22KHz、和48KHz。11KHz的采样率获得的声音称为电话音质,基本上能让你分辨出通话人的声音;22KHz称为广播音质;44.1KHz称为CD音质。采样频率越高,获得的声音文件质量越好,占用磁(光)盘的空间也就越大。一首CD音质的歌曲会占去45M左右的盘空间。
采样定理/采样频率
采样定理表明采样频率必须大于被采样信号带宽的两倍,另外一种等同的说法是奈奎斯特定律必须大于被采样信号的带宽。[1]
如果信号的带宽是 100Hz,那么为了避免混叠现象采样频率必须大于 200Hz。
换句话说就是采样频率必须至少是信号中最大频率分量频率的两倍,否则就不能从信号采样中恢复原始信号。
视频系统
在模拟视频中,采样率定义为帧频和场频,而不是概念上的像素时钟。图像采样频率是传感器积分周期的循环速度。由于积分周期远远小于重复所需时间,采样频率可能与采样时间的倒数不同。
50 Hz - PAL 视频
60 / 1.001 Hz - NTSC 视频
当模拟视频转换为数字视频的时候,出现另外一种不同的采样过程,这次是使用像素频率。一些常见的像素采样率有:
13.5 MHz - CCIR 601、D1 video
高频 luminance 成分的 混淆现象 作为 moiré pattern 出现。
在有些情况下,人们希望采样频率超出信号带宽的两倍这样就可以用
数字滤波器替换性能不好的模拟
抗混叠滤波器,这个过程称为:过采样。
以上是关于音频特征提取的主要内容,如果未能解决你的问题,请参考以下文章