Snorkel：我可以在数据集中使用不同的功能来生成标记函数VS训练分类器吗？

Question

我具有一组用于构建标签功能的功能（A组）以及一组用于训练sklearn分类器的功能（B组）

生成模型将输出一组概率标签，我可以用它们来训练我的分类器。

我是否需要将用于标签功能的功能（A组）添加到分类功能中？（B组）还是只使用生成的标签来训练我的分类器？

我正在参考snorkel spam tutorial，但我没有看到它们使用标签功能集中的功能来训练新的分类器。

[在cell 47中似乎，功能化完全使用CountVectorizer：

from sklearn.feature_extraction.text import CountVectorizer

vectorizer = CountVectorizer(ngram_range=(1, 2))
X_train = vectorizer.fit_transform(df_train_filtered.text.tolist())

X_dev = vectorizer.transform(df_dev.text.tolist())
X_valid = vectorizer.transform(df_valid.text.tolist())
X_test = vectorizer.transform(df_test.text.tolist())

然后直接拟合一个keras模型：

# Define a vanilla logistic regression model with Keras
keras_model = get_keras_logreg(input_dim=X_train.shape[1])

keras_model.fit(
    x=X_train,
    y=probs_train_filtered,
    validation_data=(X_valid, preds_to_probs(Y_valid, 2)),
    callbacks=[get_keras_early_stopping()],
    epochs=50,
    verbose=0,
)