TCN(Temporal Convolutional Network)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了TCN(Temporal Convolutional Network)相关的知识,希望对你有一定的参考价值。

参考技术A 参考论文: Temporal Convolutional Networks for Action Segmentation and Detection

       本文讲述了对于视频中人类动作片段的切分与检测任务应用了TCN的编码器解码器架构。Action segmentation and detection任务主要是用于将视频中人物在不同时段的动作切分出来,并进行识别。据说在监控和机器人行为的研究中比较有用。
       TCN全称为Temporal convolutional network,中文为时域卷积网络,融合了时域上的建模能力,卷积的低参数量下的特征提取能力。本文提出的TCN encoder-decoder如下图所示。

        使用TCN对任务进行建模的好处:
        1.比基于LSTM的循环神经网络模型训练更快,因为RNN存在时序上的计算连接;
        2.TCN更加擅长捕捉时序上的依赖关系,而且因为使用了卷积,可以捕捉到局部信息。
        3. 感受野的尺寸可以灵活调整。

TCN的输入:视频特征的集合,从视频的每一帧中提取。对于时刻t来说,对应了第t个帧,每个时刻会提取出来一个特征向量。对于整个视频,提取出来的是一个特征向量的序列。对于每一帧,都有一个对应的正确的动作标签(action label)。输出是和输入等长的序列。

因果卷积(causal convolution)convolutions where an output at time t is convolved only with elements from time t and earlier in the previous layer。

扩大卷积(dilated convolution)是通过跳过部分输入来使filter可以应用于大于filter本身长度的区域。等同于通过增加零来从原始filter中生成更大的filter。

假设一个卷积神经网络的输入是224x224x3的图像,一系列的卷积层和下采样层将图像数据变为尺寸为7x7x512数据形式。AlexNet使用了两个尺寸为4096的全连接层,最后一个有1000个神经元的全连接层用于计算分类评分。我们可以将这3个全连接层转化为卷积层:

以上是关于TCN(Temporal Convolutional Network)的主要内容,如果未能解决你的问题,请参考以下文章

论文阅读 MS-TCN++: Multi-Stage Temporal Convolutional Network for Action Segmentation

论文阅读 MS-TCN++: Multi-Stage Temporal Convolutional Network for Action Segmentation

论文阅读(Weilin Huang——arXiv2016Accurate Text Localization in Natural Image with Cascaded Convolutiona

TCN 简述

TCN时间卷积网络——解决LSTM的并发问题

python量化用时间卷积神经网络(TCN)进行股价预测