上海交大:我们做了一个医疗版MNIST数据集,发现常见AutoML算法没那么好用
上海交大研究人员创建新型开放医疗图像数据集 MedMNIST,并设计「MedMNIST 分类十项全能」,旨在促进 AutoML 算法在医疗图像分析领域的研究。 机器之心报道,作者:魔王、张倩。 项目地址: https:// medmnist.github.io/ 论文地址: https:// arxiv.org/pdf/2010.1492 5v1.pdf GitHub 地址: https:// github.com/MedMNIST/Med MNIST 数据集下载地址: https://www. dropbox.com/sh/upxrsyb5 v8jxbso/AADOV0_6pC9Tb3cIACro1uUPa?dl=0 在 AI 技术的发展中,数据集发挥了重要的作用。然而,医疗数据集的创建面临着很多难题,如数据获取、数据标注等。 近期,上海交通大学的研究人员创建了医疗图像数据集 MedMNIST,共 包含 10 个预处理开放医疗图像数据集 (其数据来自多个不同的数据源,并经过预处理)。和 MNIST 数据集一样,MedMNIST 数据集 在轻量级 28 × 28 图像上执行分类任务,所含任务覆盖主要的医疗图像模态和多样化的数据规模 。根据研究人员的设计,MedMNIST 数据集具备以下特性: 教育性:该数据集中的多模态数据来自多个具备知识共享许可证的开放医疗图像数据集