ML.NET Cookbook:(12)我想看看模型的系数
Posted dotNET跨平台
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ML.NET Cookbook:(12)我想看看模型的系数相关的知识,希望对你有一定的参考价值。
通常,一旦一个模型被训练出来,我们也会对“它学到了什么”感兴趣。
例如,如果线性模型为我们认为重要的特征赋予零权重,则可能表明建模存在一些问题。线性模型的权重也可用作对“特征重要性”的估计。
这是我们可以从训练的模型中提取学习到的参数的方法:
// 第一步:将数据加载为IDataView。
// 检索训练数据。
var trainData = mlContext.Data.LoadFromTextFile<IrisInput>(irisDataPath,
// 默认分隔符是tab,但数据集使用逗号。
separatorChar: ','
);
// 建立学习管道。
var pipeline =
// 将所有特征串联到一列“Features”中。
mlContext.Transforms.Concatenate("Features", "SepalLength", "SepalWidth", "PetalLength", "PetalWidth")
// 请注意,标签是文本,因此需要将其转换为键。
.Append(mlContext.Transforms.Conversion.MapValueToKey("Label"), TransformerScope.TrainTest)
// 在缓存检查点阶段之后的步骤中缓存内存中的数据。
.AppendCacheCheckpoint(mlContext)
// 利用多类SDCA模型对标签进行预测。
.Append(mlContext.MulticlassClassification.Trainers.SdcaMaximumEntropy());
// 训练模型。
var trainedModel = pipeline.Fit(trainData);
// 检查模型参数。
var modelParameters = trainedModel.LastTransformer.Model as MaximumEntropyModelParameters;
// 现在我们可以使用“modelParameters”来查看权重。
// “weights”是一个权重向量数组,每个类一个向量。
// 我们的问题有3个类,所以numclass将是3,权重将包含3个向量(每个向量有4个值)。
VBuffer<float>[] weights = default;
modelParameters.GetWeights(ref weights, out int numClasses);
// numClasses
// 3
// weights
// {float[4]} { float[4]} { float[4]}
// 2.45233274 0.181766108 -3.05772042
// 4.61404276 0.0578986146 -4.85828352
// - 6.934741 -0.0424297452 6.63682
// - 3.64960361 -4.072106 7.55050659
// 同样,我们也可以检查3个类的偏差。
var biases = modelParameters.GetBiases();
// [0] 1.151999 float
// [1] 8.337694 float
// [2] -9.709775 float
欢迎关注我的个人公众号”My IO“
以上是关于ML.NET Cookbook:(12)我想看看模型的系数的主要内容,如果未能解决你的问题,请参考以下文章
ML.NET Cookbook:(17)如何在分类数据上训练模型?
ML.NET Cookbook:(18)如何在文本数据上训练模型?
ML.NET Cookbook:(10)如何使用模型做出一个预测?