基于时间的预测变量/变量数据的逻辑回归(分类技术)

Posted

技术标签:

【中文标题】基于时间的预测变量/变量数据的逻辑回归(分类技术)【英文标题】:Logistic Regression(Classification Technique) on Time-dependent Predictors/variables Data 【发布时间】:2016-07-07 19:23:11 【问题描述】:

我想知道我是否可以将分类技术(例如逻辑回归)应用于变量/预测变量按时间“索引”的数据。或者如果不是,哪些分类技术适合用于这些类型的数据。

为了让您清楚地了解问题,假设我有一个因变量 Y,其值为 0 或 1(用于二元分类)或 1,2,3,...(用于“多”分类)。

我有按时间“索引”的预测变量,即 X1T1、X1T2、...、X1Tn、X2T1、X2T2、...、X2Tm、....XpTk、

在哪里

 X1T1 = values of variable X1 at time 1 (T1)
 X1T2 = values of variable X1 at time 2 (T2) 
    .
    .
 X1Tn = values of variable X1 at time n (Tn)
 X2T1 = values of variable X2 at time 1 (T1)
 X2T2 = values of variable X2 at time 2 (T2)
    .
    .
 X2Tm = values of variable X2 at time m (Tm)
    .
    .
    .
 XpTk = values of variable Xp at time k (Tk)

其中 n,m,k = 1,2,...(可变时间“索引”) p =1,2,....(预测变量数)。

对于数据视图,我们有;

 Obs   Y   X1T1   X1T2 ... X1Tn  X2T1  X2T3 ... X2Tm ...  XpTk
  1    .     .      .        .     .     .       .          .
  2    .     .      .        .     .     .       .   ...    .
  .
  .
  .
  N    .     .       .       .     .     .       .   ...    .      

我能否对这些类型的数据应用分类技术,例如逻辑回归(或其他分类技术用于“多”类别响应变量,如基于树的方法。)非常感谢!

【问题讨论】:

【参考方案1】:

您可以使用您的数据来拟合逻辑回归模型。 但是,结果可能不太好,因为算法会独立考虑每个变量。

使用您的数据拟合 LR 模型的一种方法是创建新变量,这些新变量可以被认为是彼此独立的,并保留足够的信息来表示您的原始数据。

例如)

newvar1 = mean(X1T1, X1T2, ..., X1Tn),
newvar2 = sd(X1T1, X1T2, ..., X1Tn),
newvar3 = mean increasing ratio(X1T1, X1T2, ..., X1Tn)
...

这样,您可以使用您的数据来拟合 LR 模型,即使新变量的示例还不够。

【讨论】:

以上是关于基于时间的预测变量/变量数据的逻辑回归(分类技术)的主要内容,如果未能解决你的问题,请参考以下文章

收藏 | 机器学习分类算法

收藏 | 机器学习分类算法

《机器学习实战》之逻辑回归--基于Python3--01

更改逻辑回归中分类预测变量的参考组

逻辑回归实例

逻辑回归算法的原理及实现(LR)