将输入测试数据更改为特征矩阵的维度

Posted

技术标签:

【中文标题】将输入测试数据更改为特征矩阵的维度【英文标题】:Changing the Input test data into the dimentional of feature matrix 【发布时间】:2017-02-08 17:49:15 【问题描述】:

我训练了一个具有特征矩阵维度 (200,716) 的模型,其中 200 是文档数,716 是总特征数。现在我想使用具有特征词 (7) 的输入测试数据来测试模型。如何我可以将此特征映射到我们的模型得到训练的完全相同数量的特征,这样我就可以使用 model.predict(test_data) 函数来检查模型的预测新数据。

【问题讨论】:

您应该提供有关您的问题的更多详细信息,并可能提供帮助理解问题的示例。例如:您是否使用某种指标变量矩阵来表示您的数据?是文档中的特征词吗?等 【参考方案1】:

答案对你来说不会太好,但是......你必须使用你最初使用的相同方法。没有通用的、“神奇”的方法来实现这一点,您的训练文档为原始格式,并通过某种转换 f 将其映射到特征,并且您必须存储转换本身(函数、它的字典等)。如果您删除它,您将无法执行任何操作。通常,您会将模型(分类器)和预处理管道(f,从数据到特征的转换)保存在 pickle 文件或您选择的任何其他格式中。然后,在预测期间,您只需加载这两个部分并再次将它们应用于新数据。

【讨论】:

以上是关于将输入测试数据更改为特征矩阵的维度的主要内容,如果未能解决你的问题,请参考以下文章

PCA whitening

将几何特征更改为现有数据库

是否可以仅为测试数据计算特征矩阵?

文本分析中训练和测试矩阵的相同维度? [复制]

数据表示和特征表示

Keras 功能 API:采用多个输入的拟合和测试模型