ML.NET Cookbook:(12)我想看看模型的系数

Posted dotNET跨平台

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ML.NET Cookbook:(12)我想看看模型的系数相关的知识,希望对你有一定的参考价值。

通常,一旦一个模型被训练出来,我们也会对“它学到了什么”感兴趣。

例如,如果线性模型为我们认为重要的特征赋予零权重,则可能表明建模存在一些问题。线性模型的权重也可用作对“特征重要性”的估计。

这是我们可以从训练的模型中提取学习到的参数的方法:


// 第一步:将数据加载为IDataView。
//  检索训练数据。
var trainData = mlContext.Data.LoadFromTextFile<IrisInput>(irisDataPath,
    // 默认分隔符是tab,但数据集使用逗号。
    separatorChar: ','
);

// 建立学习管道。
var pipeline =
    // 将所有特征串联到一列“Features”中。
    mlContext.Transforms.Concatenate("Features", "SepalLength", "SepalWidth", "PetalLength", "PetalWidth")
    // 请注意,标签是文本,因此需要将其转换为键。
    .Append(mlContext.Transforms.Conversion.MapValueToKey("Label"), TransformerScope.TrainTest)
    // 在缓存检查点阶段之后的步骤中缓存内存中的数据。
    .AppendCacheCheckpoint(mlContext)
    // 利用多类SDCA模型对标签进行预测。
    .Append(mlContext.MulticlassClassification.Trainers.SdcaMaximumEntropy());

// 训练模型。
var trainedModel = pipeline.Fit(trainData);

// 检查模型参数。
var modelParameters = trainedModel.LastTransformer.Model as MaximumEntropyModelParameters;

// 现在我们可以使用“modelParameters”来查看权重。
// “weights”是一个权重向量数组,每个类一个向量。
// 我们的问题有3个类,所以numclass将是3,权重将包含3个向量(每个向量有4个值)。
VBuffer<float>[] weights = default;
modelParameters.GetWeights(ref weights, out int numClasses);

// numClasses
// 3
// weights
// {float[4]}       { float[4]}         { float[4]}
// 2.45233274       0.181766108         -3.05772042
// 4.61404276       0.0578986146        -4.85828352
// - 6.934741       -0.0424297452       6.63682
// - 3.64960361     -4.072106           7.55050659

// 同样,我们也可以检查3个类的偏差。
var biases = modelParameters.GetBiases();
//   [0] 1.151999 float
//      [1] 8.337694 float
//   [2] -9.709775 float

欢迎关注我的个人公众号”My IO“

以上是关于ML.NET Cookbook:(12)我想看看模型的系数的主要内容,如果未能解决你的问题,请参考以下文章

ML.NET Cookbook:如何查看中间过程数据?

ML.NET Cookbook:(17)如何在分类数据上训练模型?

ML.NET Cookbook:(18)如何在文本数据上训练模型?

ML.NET Cookbook:(10)如何使用模型做出一个预测?

ML.NET Cookbook:(20)我如何定义自己的数据转换?

ML.NET Cookbook:如何调试实验或预览管道?