论文笔记：SAITS: SELF-ATTENTION-BASED IMPUTATION FOR TIMESERIES

Posted 2022-08-11 UQI-LIUWJ

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了论文笔记：SAITS: SELF-ATTENTION-BASED IMPUTATION FOR TIMESERIES相关的知识，希望对你有一定的参考价值。

对time-series 使用self-attention来进行补全

1 introduction

传统的处理缺失数据的方式一般有两个分类
- 直接删去只有部分观测值的样本
- 使用数据补全，将合适的数据填入
直接删去的不足
- 直接删去会导致偏差；合适的数据补全是无偏的
- 部分观测样本也是有一定的意义的
目前一些模型的不足
- BRITS、GAIN、E2GAN等模型都是autoregressive 模型（xt的数值取决于之前1~t-1中一部分数值）
  - ——>会导致compounding errors（个人理解是误差累计？就的误差会累加到xt上）
- NAOMI是non-autoregressive模型
  - 但是他的内部机制（循环）会导致补全速度很慢
self-attention机制，既是non-autoregressive，又可以解决RNN中速度慢&内存限制的问题
- ——>可以避免compounding error的问题
- ——>可以让补全质量更高，速度更快
这篇论文提出了SAITS (Self-Attention-based Imputation for Time Series) ，利用self-attention来进行时间序列补全

基于RNN的模型
- GRU-D、BRITS。。。
- 基于RNN的模型比较费时，同时有内存的约束
  - ——>处理长期时间序列的任务很困难
- 会遇到compounding error的问题
基于GAN的模型+基于VAE的模型
- GRUI、E2GAN、NAOMI
- GPPVAE、GPVAE
  - 高斯过程先验是为了让数据能够被嵌入到更平滑&更可解释的表达中
- 基于GAN和VAE的模型都是生成模型，因而训练起来比较复杂
  - GAN模型，由于他们损失函数的形式，会需要不收敛、表现不佳的情况
  - VAE模型，他们由有隐空间中采样得到的
    - ——>往往得不到固定的结构/数据分布
    - ——>使得补全内容难以解释，后续分析比较困难
基于self-attention的模型
- CSDA：cross-dimensional self-attention，三个维度（time，location，measurement）的自注意力，以补全时空数据中的确实信息【2019，未开源】
  - CDSA: cross dimensional self-attention for multivariate, geo-tagged time series imputation
- DeepMVI：多维时间序列的缺失值不全【2021，未开源】
  - Transformer with a convolutional window feature and a kernel regression
  - Missing value imputation on multidimensional time series
- NRTSI【2021】
  - Nrtsi: Non-recurrent time series imputation
  - 将时间序列处理成(time,data)的元组，然后使用Transformer 的encoder来进行建模