无法在张量流中加载音频文件(Windows10)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了无法在张量流中加载音频文件(Windows10)相关的知识,希望对你有一定的参考价值。

这可能有问题。我可以像这样audio_binary = tf.read_file(wav_file_path)加载audio_binary但是当我尝试用这个读取wav时:

from tensorflow.contrib import ffmpeg
waveform = ffmpeg.decode_audio( audio_binary, file_format='wav', samples_per_second=16000, channel_count=1)

我得到错误ImportError: No module named 'tensorflow.contrib.ffmpeg.ops'

我也试过这样做:

from tensorflow.contrib.framework.python.ops import audio_ops as contrib_audio
wav_decoder = contrib_audio.decode_wav(audio_binary, desired_channels=1)

我得到这个错误InvalidArgumentError: Header mismatch: Expected RIFF but found NIST

顺便说一下,我在Jupyter笔记本中使用tensorflow-gpu。

任何帮助将受到高度赞赏。谢谢!

答案

万一有人有同样的问题。我使用的是TIMIT数据库,他们的文件虽然是.wav,却有不同的编码(NIST)。我必须将它们更改为RIFF,就像这个forfiles /s /m *.wav /c "cmd /c sph2pipe -f wav @file @fnameRIFF.wav"和使用第二个命令contrib_audio.decode_wav(...)

基于这个答案:Change huge amount of data from NIST to RIFF wav file

这个页面:http://soundfile.sapp.org/doc/WaveFormat/

以上是关于无法在张量流中加载音频文件(Windows10)的主要内容,如果未能解决你的问题,请参考以下文章

无法在 Windows 10 中加载 repositories.cfg [关闭]

无法在Windows 10中加载repositories.cfg [关闭]

当枢轴选择更改时,如何在枢轴项目中加载图像后加载音频文件

无法在 Windows 10 上的 R 中加载 statnet

DLL 无法在 windows server 2012 中加载

重置张量流优化器