ml.net

Where to Specify Time to Train in ML.NET

僤鯓⒐⒋嵵緔 提交于 2021-01-06 05:42:40
问题 I'm evaluating ML.NET Model Builder (Preview) 16.1.0.2027905. When I go to train, the Builder lets me specify "Time to train (seconds)" (See Picture): However, when I get to Step#6 and generate the code, I can't seem to find where the "Time to train" is specified... The ML.NET Builder creates this function for me automatically in the ModelBuilder.cs file: public static ITransformer TrainModel(MLContext mlContext, IDataView trainingDataView, IEstimator<ITransformer> trainingPipeline) { Console

Where to Specify Time to Train in ML.NET

孤街浪徒 提交于 2021-01-06 05:42:06
问题 I'm evaluating ML.NET Model Builder (Preview) 16.1.0.2027905. When I go to train, the Builder lets me specify "Time to train (seconds)" (See Picture): However, when I get to Step#6 and generate the code, I can't seem to find where the "Time to train" is specified... The ML.NET Builder creates this function for me automatically in the ModelBuilder.cs file: public static ITransformer TrainModel(MLContext mlContext, IDataView trainingDataView, IEstimator<ITransformer> trainingPipeline) { Console

ML.NET生成器带来了许多错误修复和增强功能以及新功能

落花浮王杯 提交于 2021-01-05 13:51:11
ML.NET是一个开源的跨平台机器学习框架,适合 .NET 开发人员。它允许将机器学习集成到 .NET 应用中,而无需离开 .NET 生态系统,甚至拥有 ML 或数据科学背景。ML.NET工具(Visual Studio 中的 UI 模型生成器和跨平台 ML.NET CLI),可根据您的场景和数据自动训练自定义机器学习模型。 此版本ML.NET生成器带来了许多错误修复和增强功能以及新功能,包括高级数据加载选项和来自 SQL Server的流训练数据。 高级数据加载选项 以前,模型生成器不提供任何数据加载选项,它依赖于 AutoML 来检测列、标头和分隔符以及十进制分隔符样式。 让我们看一下模型生成器中使用出租车费数据集中新的高级数据加载选项。这是一个回归问题,您可以根据旅行距离、付款类型和乘客人数等几个因素预测出租车票价金额。 在模型生成器中,选择值预测方案和本地训练环境后,您将最终进入 "数据" 步骤。选择"文件" 作为数据源类型 ,浏览出租车票价数据集,选择数据集后,将 "列"更改为"预测" fare_amount。 选择"高级数据"选项以打开高级数据加载选项对话框。 在此对话框中,有两个部分 - 列设置 和数据格式 。 列设置 在" 列设置 "部分中,您可以将每个要素列(用于预测标签的列)的列更改为分类、文本、数字或忽略: 分类列包含在标记组离散数量中的数据。例如

ML.NET Show which score relates to which label

南笙酒味 提交于 2021-01-04 09:09:27
问题 With ML.Net I am using a classifier for text interpretation. The prediction has a score column as float[] and a predicted label. This works in that the highest score relates to the predicted label, but the other scores are just floats in no particular order. How do I know which score relates to which label? How can I see what the second highest weighted label? For example, I get this back: 0.00005009 0.00893076 0.1274763 0.6209787 0.2425644 The 0.6 is my predicted label, but I also need to

How to resolve the error “cannot import name 'string_int_label_map_pb2' from 'object_detection.protos'”

ⅰ亾dé卋堺 提交于 2020-12-27 07:23:54
问题 My friends and I are partaking in a hackathon and are stuck on this one tutorial on training an object detection model: https://tensorflow-object-detection-api-tutorial.readthedocs.io/en/latest/training.html But after three people have tried to follow the above tutorial to the letter, we are all stuck on the creating TfRecord step: https://tensorflow-object-detection-api-tutorial.readthedocs.io/en/latest/training.html#create-tensorflow-records We get the error message: ImportError: cannot

How to resolve the error “cannot import name 'string_int_label_map_pb2' from 'object_detection.protos'”

被刻印的时光 ゝ 提交于 2020-12-27 07:23:32
问题 My friends and I are partaking in a hackathon and are stuck on this one tutorial on training an object detection model: https://tensorflow-object-detection-api-tutorial.readthedocs.io/en/latest/training.html But after three people have tried to follow the above tutorial to the letter, we are all stuck on the creating TfRecord step: https://tensorflow-object-detection-api-tutorial.readthedocs.io/en/latest/training.html#create-tensorflow-records We get the error message: ImportError: cannot

使用 .NET 5 体验大数据和机器学习

守給你的承諾、 提交于 2020-12-19 02:43:29
翻译:精致码农-王亮 原文:http://dwz.win/XnM .NET 5 旨在提供统一的运行时和框架,使其在各平台都有统一的运行时行为和开发体验。微软发布了与 .NET 协作的大数据(.NET for Spark)和机器学习(ML.NET)工具,这些工具共同提供了富有成效的端到端体验。在本文中,我们将介绍 .NET for Spark、大数据、ML.NET 和机器学习的基础知识,我们将研究其 API 和功能,向你展示如何开始构建和消费你自己的 Spark 作业和 ML.NET 模型。 什么是大数据 大数据是一个几乎不言自明的行业术语。该术语指的是大型数据集,通常涉及 TB 甚至 PB 级的信息,这些数据集被用作分析的输入,以揭示数据中的模式和趋势。大数据与传统工作负载之间的关键区别在于,大数据往往过于庞大、复杂或多变,传统数据库和应用程序无法处理。一种流行的数据分类方式被称为 "3V"(译注:即3个V,Volume 容量、Velocity 速度、Variety 多样性)。 大数据解决方案是为适应高容量、处理复杂多样的数据结构而定制的,并通过批处理(静态)和流处理(动态)来管理速度。 大多数大数据解决方案都提供了在数据仓库中存储数据的方式,数据仓库通常是一个为快速检索和为并行处理而优化的分布式集群。处理大数据往往涉及多个步骤,如下图所示: .NET 5

使用 .NET 5 体验大数据和机器学习

a 夏天 提交于 2020-11-20 16:26:36
2020 中国.NET 开发者峰会正式启动 ,欢迎大家提交演讲主题或者购买超级早鸟票。 翻译:精致码农-王亮 原文:http://dwz.win/XnM .NET 5 旨在提供统一的运行时和框架,使其在各平台都有统一的运行时行为和开发体验。微软发布了与 .NET 协作的大数据(.NET for Spark)和机器学习(ML.NET)工具,这些工具共同提供了富有成效的端到端体验。在本文中,我们将介绍 .NET for Spark、大数据、ML.NET 和机器学习的基础知识,我们将研究其 API 和功能,向你展示如何开始构建和消费你自己的 Spark 作业和 ML.NET 模型。 什么是大数据 大数据是一个几乎不言自明的行业术语。该术语指的是大型数据集,通常涉及 TB 甚至 PB 级的信息,这些数据集被用作分析的输入,以揭示数据中的模式和趋势。大数据与传统工作负载之间的关键区别在于,大数据往往过于庞大、复杂或多变,传统数据库和应用程序无法处理。一种流行的数据分类方式被称为 "3V"(译注:即3个V,Volume 容量、Velocity 速度、Variety 多样性)。 大数据解决方案是为适应高容量、处理复杂多样的数据结构而定制的,并通过批处理(静态)和流处理(动态)来管理速度。 大多数大数据解决方案都提供了在数据仓库中存储数据的方式