微软发布开源跨平台机器学习框架ML.NET 0.2版本

Posted 程序你好

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了微软发布开源跨平台机器学习框架ML.NET 0.2版本相关的知识,希望对你有一定的参考价值。

上个月在Build 2018年微软发布了ML.NET 0.1,一个跨平台的开源机器学习框架。今天又发布了ML.NET 0.2。这个版本侧重于添加新的ML任务,比如集群,使验证模型更容易,为ML.NET示例添加一个全新的repo,并解决我们在GitHub repo中收到的各种问题和反馈。



下面提到了ML.NET 0.2版本的一些亮点:

  

新的机器学习任务:集群


集群是一种无监督的学习任务,它根据项目的特征对项目集进行分组。它识别哪些项目比其他项目更相似。



这在一些场景中可能很有用,比如根据主题将新闻文章组织成组,根据用户的购物习惯对用户进行分段,以及根据观众对电影的喜好对观众进行分组。



Iris Flower示例演示了如何使用ML.NET 0.2中的集群


通过交叉验证和培训测试更容易进行模型验证


交叉验证是一种验证模型统计性能的方法。它不需要单独的测试数据集,而是使用您的训练数据来测试您的模型(它将数据划分为不同的数据,以便进行培训和测试,并多次执行)。使用ML.NET 0.2,您现在可以使用交叉验证,这里有一个很好的例子。(https://github.com/dotnet/machinelearning/blob/78810563616f3fcb0b63eb8a50b8b2e62d9d65fc/test/Microsoft.ML.Tests/Scenarios/SentimentPredictionTests.cs#L51)



Train-test是在单独的数据集中测试模型的快捷方式。参见这里的示例用法。(https://github.com/dotnet/machinelearning/blob/78810563616f3fcb0b63eb8a50b8b2e62d9d65fc/test/Microsoft.ML.Tests/Scenarios/SentimentPredictionTests.cs#L36)


使用具有CollectionDataSource的数据对象进行训练 


net 0.1允许从带分隔符的文本文件加载数据。net 0.2中的CollectionDataSource增加了使用对象集合作为LearningPipeline输入的能力。



下面的代码片段展示了如何使用ML.NET 0.2中的CollectionDataSource。


新的ML.NET示例repo


我们创建了一个新的repo https://github.com/dotnet/machinelearning-samples,并添加了一些开始和结束应用程序示例。



  • 情绪分析(二进制分类)


这个示例演示了如何使用ML.NET分析客户评论的情绪(正面或负面)。该示例使用了IMDB和Yelp评论。


  • 鸢尾花的分类(多类分类)


这个样本的中心是预测虹膜花的类型(setosa, versicolor,或virginica)基于花的参数,如花瓣长度,花瓣宽度等。


  • 出租汽车费预测(回归)


出租车票价预测示例演示了如何构建一个ML.NET模型来预测纽约市出租车票价。本样本采用回归模型,考虑了乘客数量、信用类型和旅行距离等特征。


  • 虹膜数据集聚类分析(聚类)


这个示例演示了如何通过对Iris数据集执行集群分析,从而使用ML.NET构建集群模型。


  • GitHub问题分类(多类分类)


这是一个E2E示例,展示了如何使用ML.NET构建GitHub的问题分类器。


这篇博文只介绍了一些ML.NET 0.2版本的顶级声明,在这里可以找到ML.NET 0.2的完整版本说明(https://github.com/GalOshri/machinelearning/blob/f026db2cdba1858b0e8bea2ddf2a4092a61bd708/docs/release-notes/0.2/release-0.2.md)。



帮助建立ML.NET以满足您的需求


如果你还没有使用过机器学习,请试试ML.NET。



https://github.com/dotnet/machinelearning




以上是关于微软发布开源跨平台机器学习框架ML.NET 0.2版本的主要内容,如果未能解决你的问题,请参考以下文章

这次,Google 真的“造人”了;微软开源 ML.NET 跨平台机器学习框架

开源的,跨平台的.NET机器学习框架ML.NET

一个开源的,跨平台的.NET机器学习框架ML.NET

当.NET遇到机器学习

C#开源跨平台机器学习框架ML.NET----结合SqlSugar进行多类分类

为什么最新版ML.NET对.NET机器学习社区如此重要?