基于时间的预测变量/变量数据的逻辑回归(分类技术)
Posted
技术标签:
【中文标题】基于时间的预测变量/变量数据的逻辑回归(分类技术)【英文标题】:Logistic Regression(Classification Technique) on Time-dependent Predictors/variables Data 【发布时间】:2016-07-07 19:23:11 【问题描述】:我想知道我是否可以将分类技术(例如逻辑回归)应用于变量/预测变量按时间“索引”的数据。或者如果不是,哪些分类技术适合用于这些类型的数据。
为了让您清楚地了解问题,假设我有一个因变量 Y,其值为 0 或 1(用于二元分类)或 1,2,3,...(用于“多”分类)。
我有按时间“索引”的预测变量,即 X1T1、X1T2、...、X1Tn、X2T1、X2T2、...、X2Tm、....XpTk、
在哪里
X1T1 = values of variable X1 at time 1 (T1)
X1T2 = values of variable X1 at time 2 (T2)
.
.
X1Tn = values of variable X1 at time n (Tn)
X2T1 = values of variable X2 at time 1 (T1)
X2T2 = values of variable X2 at time 2 (T2)
.
.
X2Tm = values of variable X2 at time m (Tm)
.
.
.
XpTk = values of variable Xp at time k (Tk)
其中 n,m,k = 1,2,...(可变时间“索引”) p =1,2,....(预测变量数)。
对于数据视图,我们有;
Obs Y X1T1 X1T2 ... X1Tn X2T1 X2T3 ... X2Tm ... XpTk
1 . . . . . . . .
2 . . . . . . . ... .
.
.
.
N . . . . . . . ... .
我能否对这些类型的数据应用分类技术,例如逻辑回归(或其他分类技术用于“多”类别响应变量,如基于树的方法。)非常感谢!
【问题讨论】:
【参考方案1】:您可以使用您的数据来拟合逻辑回归模型。 但是,结果可能不太好,因为算法会独立考虑每个变量。
使用您的数据拟合 LR 模型的一种方法是创建新变量,这些新变量可以被认为是彼此独立的,并保留足够的信息来表示您的原始数据。
例如)
newvar1 = mean(X1T1, X1T2, ..., X1Tn),
newvar2 = sd(X1T1, X1T2, ..., X1Tn),
newvar3 = mean increasing ratio(X1T1, X1T2, ..., X1Tn)
...
这样,您可以使用您的数据来拟合 LR 模型,即使新变量的示例还不够。
【讨论】:
以上是关于基于时间的预测变量/变量数据的逻辑回归(分类技术)的主要内容,如果未能解决你的问题,请参考以下文章