MATLAB 中的音频需要帮助
Posted
技术标签:
【中文标题】MATLAB 中的音频需要帮助【英文标题】:Help required with audio in MATLAB 【发布时间】:2010-08-04 14:10:39 【问题描述】:我正在尝试编写一个 .m 文件来从音轨中提取能量特征,但我似乎在实现时遇到了问题:
% Formula for calculating RMS
[f, fs, nb] = wavread('Three.wav');
frameWidth=441; %10ms
numSamples=length(x);
numFrames=(numSamples/1);
energy(frame)=0;
for frame=1:numFrames,
startSample=(frame-1)*frameWidth+1;
endSample=startSample+frameWidth-1;
% Calculate frame energy
for i=startSample:endSample
energy(frame)=energy(frame)+x(i)^2;
end
end
我在 MATLAB 中运行该文件并收到以下错误:
???试图访问 x(2);索引超出范围,因为 numel(x)=1。 ==> myrms 在 12 时出错 能量(帧)=能量(帧)+x(i)^2;
任何帮助将不胜感激。
【问题讨论】:
【参考方案1】:您应该使用f
而不是x
,因为f
是从您的.wav 文件加载的实际信号。变量 x
可能只是您工作区中的某个其他标量,这就是您收到所见错误的原因。
应该对您的代码进行一些其他更正/改进。首先,作为Paul R pointed out,您需要更正计算numFrames
的方式。其次,energy
应该被初始化为一个零向量。第三,您可以将内部 for 循环简化为单行向量化操作。
以下是我将如何重写您的代码(编辑:基于 cmets,我更新了代码以保存在循环中计算的一些额外变量):
[y, fs, nb] = wavread('Three.wav'); %# Load the signal into variable y
frameWidth = 441; %# 10 msec
numSamples = length(y); %# Number of samples in y
numFrames = floor(numSamples/frameWidth); %# Number of full frames in y
energy = zeros(1,numFrames); %# Initialize energy
startSample = zeros(1,numFrames); %# Initialize start indices of frame
endSample = zeros(1,numFrames); %# Initialize end indices of frame
for frame = 1:numFrames %# Loop over frames
startSample(frame) = (frame-1)*frameWidth+1; %# Starting index of frame
endSample(frame) = frame*frameWidth; %# Ending index of frame
frameIndex = startSample(frame):endSample(frame); %# Indices of frame samples
energy(frame) = sum(y(frameIndex).^2); %# Calculate frame energy
end
【讨论】:
太棒了。刚刚注意到我在最初的帖子中也犯了一个错误,我根本不应该使用 f,我什至没有把它写在我写初始代码的纸上的任何地方。多么尴尬。无论如何,感谢您的帮助,非常感谢。 我不知道您是否会收到我已回复此问题的通知,但无论如何都可以。有没有办法将标签或标签应用于创建的每个框架?即使它像“Frame 1”“Frame 2”等一样基本。我想自己执行一些功能来找到我想要提取的歌曲区域,但是我不知道如何调用这些帧有那个数据。例如,如果我执行自相关,然后执行峰值检测功能,然后我想将该帧映射回歌曲中的特定位置,以便提取缩略图。 @Velocity:一种方法是保存您在循环中计算的startSample
和endSample
的值。我已经更新了答案中的代码以显示如何执行此操作。【参考方案2】:
这行不应该:
numFrames=(numSamples/1);
是这样的:
numFrames=(numSamples / frameWidth);
或者可能:
numFrames=((numSamples + frameWidth - 1) / frameWidth);
?
【讨论】:
我最初有:numFrames=flux(numSamples/numFrames) 但 MATLAB 也不喜欢这样。 如果numFrames
不是一个精确的整数,可能还需要调用FLOOR。
是的,我完全是白痴。我看不清自己潦草的笔迹。 FLOOR 是我想要的,而不是通量。以上是关于MATLAB 中的音频需要帮助的主要内容,如果未能解决你的问题,请参考以下文章