C#开源跨平台机器学习框架ML.NET----介绍与环境搭建

泄露秘密 提交于 2019-12-28 06:36:55

ML.NET教程和API:https://docs.microsoft.com/zh-cn/dotnet/machine-learning/

现在学习机器学习这块时,基本上都是要先学习Python,还要自己去学习更多的样本数据教程,这样对于使用C#学习机器学习的基础并不容易,于是微软推出了ML.NET的开源跨平台机器学习框架。

什么是ML.NET?

ML.NET 使你能够在联机或脱机场景中将机器学习添加到 .NET 应用程序中。借助此功能,可以使用应用程序的可用数据进行自动预测,而无需连接到网络。

通过ML.NET进行的预测类型的包括:

分类/类别划分

自动将客户反馈划分为正面和负面类别

回归/预测连续值

根据大小和位置预测房屋价格

异常情况检测

检测欺诈性银行交易

建议

根据在线购物者之前的购买情况向其建议可能想要购买的产品

ML.NET的代码工作流

以下关系图表示应用程序代码结构,以及模型开发的迭代过程:

将训练数据收集并加载到 IDataView 对象中

  • 指定操作的管道,以提取特征并应用机器学习算法
  • 通过在管道上调用 Fit() 来训练模型
  • 评估模型并通过迭代进行改进
  • 将模型保存为二进制格式,以便在应用程序中使用
  • 将模型加载回 ITransformer 对象
  • 通过调用 CreatePredictionEngine.Predict() 进行预测

机器学习模型

ML.NET 模型是一个对象,它包含为了获得预测输出而要对输入数据执行的转换。

Basic

最基本的模型是二维线性回归,其中一个连续数量与另一个连续数量成比例关系,如上述房价示例所示。

Price=b+Size∗w

参数 b 和 w通过根据一组 (size, price) 对拟合一根直线来进行估算。用于查找模型参数的数据称为训练数据。机器学习模型的输入称为特征

Size是唯一的特征。用于训练机器学习模型的真值称为标签。Price值是标签。

更复杂

更复杂的模型使用事务文本描述将金融事务分类为类别。

通过删除冗余的字词和字符,以及对字词和字符组合进行计数,每个事务描述都被分解为一组特征。该特征集用于基于训练数据中的类别集训练线性模型。新描述与训练集中的描述越相似,它就越有可能被分配到同一类别。

房屋价格模型和文本分类模型均为线性模型。根据数据的性质和要解决的问题,还可以使用决策树模型、广义加性模型和其他模型。可以在任务中找到有关模型的详细信息。

ML.NET的创建与安装

ML.NET安装的几个核心注意事项

  1. .NET Framework的版本不能低于4.6.1
  2. 只能在64位的系统下运行,不支持x86和Any CPU

创建项目

我用的VS2017,接下来我们就看看怎么在VS2017中使用ML.NET

打开VS2017,新建项目,选择Windows窗体应用,输入项目名称为MLDemo,框架选择.Net Framework 4.6.1

创建好后在右侧解决方法中鼠标右键引用--管理NuGet程序包

在浏览框输入MLNET搜索,找到MLNET后进行安装

点击安装,如果此时.net framework不是4.6.1或以上,这里就会报错了

下面提示已完成代表安装成功了

我们从左侧引用处可以看到了ML.NET相关的库已经都安装加载进来

配置管理器设置

安装好ML.NET后,需要我们进行配置管理器设置,主要就是输出为64位的方案,前面提到过,ML.NET只支持X64的平台。

点击中间位置的Debug Any CPU右边的下拉按钮,选择配置管理器

点击右键活动解决方案平台的下拉按钮选择新建

按下图点击确定

我们重新看一下现在平台改为x64了,到这里ML.NET的框架就搭建完成了。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!