如何无损连接ogg vorbis文件?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何无损连接ogg vorbis文件?相关的知识,希望对你有一定的参考价值。

我正在尝试将多个ogg vorbis文件连接成一个。

我知道理论上它应该足够了:

cat 1.ogg 2.ogg > combined.ogg

但这有缺点:

  • 并非所有玩家都支持这样创建的文件(gstreamer不支持)
  • 这样做的球员,不能顺利连接他们,但会创造丑陋的分裂第二次暂停
  • 寻求似乎不可能

我不想放松质量,所以我可以将它们重新编码为像flac这样的无损格式,但这会让文件大小爆炸。

似乎没有工具可以做到这一点。例如,oggCat将重新编码音频,从而导致质量轻微下降,而ffmpeg concat demuxer将无法用于所有输入文件。我打开this superuser question找工具,但当我发现没有工具时写了我自己的工具。

所以我尝试使用libogg和libvorbis手动将输入文件中的ogg数据包连接到输出文件的ogg页面。假设所有ogg输入文件都使用完全相同的参数进行编码。

我想出了以下代码:

#include <ogg/ogg.h>
#include <vorbis/codec.h>
#include <stdio.h>
#include <unistd.h>
#include <stdbool.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <stdlib.h>
#include <time.h>

int read_page(int fd, ogg_sync_state *state, ogg_page *page)
{
    int ret;
    ssize_t bytes;

    while(ogg_sync_pageout(state, page) != 1) {
        char *buffer = ogg_sync_buffer(state, 4096);
        if (buffer == NULL) {
            fprintf(stderr, "ogg_sync_buffer failed
");
            return -1;
        }
        bytes = read(fd, buffer, 4096);
        if (bytes == 0) {
            return -1;
        }
        ret = ogg_sync_wrote(state, bytes);
        if (ret != 0) {
            fprintf(stderr, "ogg_sync_wrote failed
");
            return -1;
        }
    }
    return 0;
}

int main(int argc, char *argv[])
{
    int ret;
    ogg_sync_state state;
    ogg_page page;
    int serial;
    ogg_stream_state sstate;
    bool found_bos;
    ogg_packet packet;
    int fd;
    int i;
    vorbis_info info;
    vorbis_comment comment;
    int vorbis_header_read;
    ssize_t bytes;
    ogg_stream_state out_stream;
    ogg_page out_page;

    if (argc < 2) {
        fprintf(stderr, "usage: %s file.ogg
", argv[0]);
        return 1;
    }

    srand(time(NULL));
    ogg_stream_init(&out_stream, rand());

    // go through all input files
    for (i = 1; i < argc; i++) {
        vorbis_header_read = 0;
        found_bos = false;

        fd = open(argv[i], O_RDONLY);
        if (fd < 0) {
            fprintf(stderr, "cannot open %s
", argv[1]);
            return 1;
        }

        ret = ogg_sync_init(&state);
        if (ret != 0) {
            fprintf(stderr, "ogg_sync_init failed
");
            return 1;
        }

        vorbis_info_init(&info);
        vorbis_comment_init(&comment);

        // go through all ogg pages
        while (read_page(fd, &state, &page) == 0) {
            serial = ogg_page_serialno(&page);

            if (ogg_page_bos(&page)) {
                if (found_bos) {
                    fprintf(stderr, "cannot handle more than one stream
");
                    return 1;
                }
                ret = ogg_stream_init(&sstate, serial);
                if (ret != 0) {
                    fprintf(stderr, "ogg_stream_init failed
");
                    return 1;
                }
                found_bos = true;
            }

            if (!found_bos) {
                fprintf(stderr, "cannot continue without bos
");
                return 1;
            }

            ret = ogg_stream_pagein(&sstate, &page);
            if (ret != 0) {
                fprintf(stderr, "ogg_stream_pagein failed
");
                return 1;
            }

            // if this is the last page, then only write it if we are in the
            // last file
            if (ogg_page_eos(&page) && i != argc - 1) {
                continue;
            }

            // go through all (hopefully vorbis) packets
            while((ret = ogg_stream_packetout(&sstate, &packet)) != 0) {
                if (ret != 1) {
                    fprintf(stderr, "ogg_stream_packetout failed
");
                    return 1;
                }

                // test if this stream is vorbis
                if (vorbis_header_read == 0) {
                    ret = vorbis_synthesis_idheader(&packet);
                    if (ret == 0) {
                        fprintf(stderr, "stream is not vorbis
");
                        return 1;
                    }
                }

                // read exactly three vorbis headers
                if (vorbis_header_read < 3) {
                    ret = vorbis_synthesis_headerin(&info, &comment, &packet);
                    if (ret != 0) {
                        fprintf(stderr, "vorbis_synthesis_headerin failed
");
                        return 1;
                    }
                    // if this is the first file, copy the header packet to the
                    // output
                    if (i == 1) {
                        ret = ogg_stream_packetin(&out_stream, &packet);
                        if (ret != 0) {
                            fprintf(stderr, "ogg_stream_packetin failed
");
                            return 1;
                        }
                    }
                    vorbis_header_read++;
                    continue;
                }

                // if this is the first file, write a page to the output
                if (vorbis_header_read == 3 && i == 1) {
                    while ((ret = ogg_stream_flush(&out_stream, &out_page)) != 0) {
                        bytes = write(STDOUT_FILENO, out_page.header, out_page.header_len);
                        if (bytes != out_page.header_len) {
                            fprintf(stderr, "write failed
");
                            return 1;
                        }
                        bytes = write(STDOUT_FILENO, out_page.body, out_page.body_len);
                        if (bytes != out_page.body_len) {
                            fprintf(stderr, "write failed
");
                            return 1;
                        }
                    }
                    vorbis_header_read++;
                }

                ogg_stream_packetin(&out_stream, &packet);
                do {
                    ret = ogg_stream_pageout(&out_stream, &out_page);
                    if (ret == 0) break;
                    bytes = write(STDOUT_FILENO, out_page.header, out_page.header_len);
                    if (bytes != out_page.header_len) {
                        fprintf(stderr, "write failed
");
                        return 1;
                    }
                    bytes = write(STDOUT_FILENO, out_page.body, out_page.body_len);
                    if (bytes != out_page.body_len) {
                        fprintf(stderr, "write failed
");
                        return 1;
                    }
                } while (!ogg_page_eos(&out_page));

            }
        }

        vorbis_info_clear(&info);
        vorbis_comment_clear(&comment);

        ret = ogg_sync_clear(&state);
        if (ret != 0) {
            fprintf(stderr, "ogg_sync_clear failed
");
            return 1;
        }

        ret = ogg_stream_clear(&sstate);
        if (ret != 0) {
            fprintf(stderr, "ogg_stream_clear failed
");
            return 1;
        }

        close(fd);
    }

    ogg_stream_clear(&out_stream);

    return 0;
}

这几乎可以工作,但在vorbis流连接的点处插入几乎听不见的咔嗒声。

怎么做到这一点?

它可以完成吗?

答案

这是一个有趣的... :)

如果您可以在文件之间支付几毫秒的静音/偏差,只需在两个流之间丢弃几个静默数据包(我必须检查每个数据包中确切位模式的规范,但这应该不难找出你是否可以访问解码器的源代码)。

如果你负担不起沉默/歪斜,你可能需要重新编码,因为唯一的另一个选择是旋转压缩数据来改变波形连接部分的斜率......

编辑

另一种选择是在连接文件的点处将平滑算法应用于PCM数据。这不是一件容易的事,但想法是你希望波形在文件之间“平滑”。这就是我所拥有的一切......

编辑2

为了清楚起见,假设源文件使用相同的参数,问题的示例代码将几乎完美地工作。缺少的一件事是保持接缝不被听见的方法。我建议加入几个无声数据包就可以处理它,但是对于那些负担不起的人,可以考虑(尽可能纯粹的猜测)考虑将接头周围两个数据包的楼层乘数减少一个来制作缝不太明显。

以上是关于如何无损连接ogg vorbis文件?的主要内容,如果未能解决你的问题,请参考以下文章

使用 Vorbis 和 NAudio 播放 OGG 文件

MAC OSX Intel LLVM 汇编程序错误(导致 Vorbis OGG 加载程序崩溃)

使用 Ogg Flac 和 Vorbis 在 Fedora 中构建 libsndfile

目标 c - 将 mpmediaitem 转换为 ogg vorbis

U3D音频系统

在Flash / Flex应用程序中使用Ogg Vorbis