auto-sklearn

上海交大:我们做了一个医疗版MNIST数据集,发现常见AutoML算法没那么好用

|▌冷眼眸甩不掉的悲伤 提交于 2020-11-04 19:56:53
上海交大研究人员创建新型开放医疗图像数据集 MedMNIST,并设计「MedMNIST 分类十项全能」,旨在促进 AutoML 算法在医疗图像分析领域的研究。 机器之心报道,作者:魔王、张倩。 项目地址: https:// medmnist.github.io/ 论文地址: https:// arxiv.org/pdf/2010.1492 5v1.pdf GitHub 地址: https:// github.com/MedMNIST/Med MNIST 数据集下载地址: https://www. dropbox.com/sh/upxrsyb5 v8jxbso/AADOV0_6pC9Tb3cIACro1uUPa?dl=0 在 AI 技术的发展中,数据集发挥了重要的作用。然而,医疗数据集的创建面临着很多难题,如数据获取、数据标注等。 近期,上海交通大学的研究人员创建了医疗图像数据集 MedMNIST,共 包含 10 个预处理开放医疗图像数据集 (其数据来自多个不同的数据源,并经过预处理)。和 MNIST 数据集一样,MedMNIST 数据集 在轻量级 28 × 28 图像上执行分类任务,所含任务覆盖主要的医疗图像模态和多样化的数据规模 。根据研究人员的设计,MedMNIST 数据集具备以下特性: 教育性:该数据集中的多模态数据来自多个具备知识共享许可证的开放医疗图像数据集

如何高效快速准确地完成ML任务,这4个AutoML库了解一下

拜拜、爱过 提交于 2020-10-02 14:40:39
  选自TowardsDataScience    作者:Andre Ye    机器之心编译    编辑:陈萍、杜伟    AutoML 是当前深度学习领域的热门话题。只需要很少的工作,AutoML 就能通过快速有效的方式,为你的 ML 任务构建好网络模型,并实现高准确率。简单有效!数据预处理、特征工程、特征提取和特征选择等任务皆可通过 AutoML 自动构建。      图源:https://unsplash.com/photos/pjAH2Ax4uWk   自动机器学习(Automated Machine Learning, AutoML)是一个新兴的领域,在这个领域中,建立机器学习模型来建模数据的过程是自动化的。AutoML 使得建模更容易,并且每个人都更容易掌握。   在本文中,作者详细介绍了四种自动化的 ML 工具包,分别是 auto-sklearn、TPOT、HyperOpt 以及 AutoKeras。如果你对 AutoML 感兴趣,这四个 Python 库是最好的选择。作者还在文章结尾文章对这四个工具包进行了比较。    auto-sklearn   auto-sklearn 是一个自动机器学习工具包,它与标准 sklearn 接口无缝集成,因此社区中很多人都很熟悉该工具。通过使用最近的一些方法,比如贝叶斯优化,该库被用来导航模型的可能空间

如何高效、快速、准确地完成ML任务,这4个AutoML库了解一下

寵の児 提交于 2020-09-27 12:27:12
AutoML 是当前深度学习领域的热门话题。只需要很少的工作,AutoML 就能通过快速有效的方式,为你的 ML 任务构建好网络模型,并实现高准确率。简单有效!数据预处理、特征工程、特征提取和特征选择等任务皆可通过 AutoML 自动构建。 选自TowardsDataScience,作者:Andre Ye,机器之心编译,编辑:陈萍、杜伟。 图源:https://unsplash.com/photos/pjAH2Ax4uWk 自动机器学习(Automated Machine Learning, AutoML)是一个新兴的领域,在这个领域中,建立机器学习模型来建模数据的过程是自动化的。AutoML 使得建模更容易,并且每个人都更容易掌握。 在本文中,作者详细介绍了四种自动化的 ML 工具包,分别是 auto-sklearn、TPOT、HyperOpt 以及 AutoKeras。如果你对 AutoML 感兴趣,这四个 Python 库是最好的选择。作者还在文章结尾文章对这四个工具包进行了比较。 auto-sklearn auto-sklearn 是一个自动机器学习工具包,它与标准 sklearn 接口无缝集成,因此社区中很多人都很熟悉该工具。通过使用最近的一些方法,比如贝叶斯优化,该库被用来导航模型的可能空间,并学习推理特定配置是否能很好地完成给定任务。 该库由 Matthias