PLSC

五行代码实现千万类别分类网络,飞桨大规模分类库揭秘

故事扮演 提交于 2020-04-06 09:45:32
“桃花一簇无开主,可爱深红爱浅红。 黄四娘家花满蹊,千朵万朵压枝低。 留连戏蝶时时舞,自在娇莺恰恰啼。” 春天来了,经过一个冬天的“窖藏”,按耐不住的小伙伴纷纷行动了起来,踏一踏满园的春色,赶一趟娇艳的花丛。 这时候带着小盆友的父母却有一个共同的烦恼,因为小盆友最爱问一个问题:“爸爸妈妈,这是什么花?”此时不要慌,拿出你的手机,打开手机百度“扫一扫”,就会看到一个“识花”的功能,一拍即可识别花的种类。 下载安装命令 ## CPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle ## GPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu 再一次感慨科技带来的便利的同时,你是否思考过这一神奇“魔法”背后的技术。自然界中花的种类多达45万种,存在的生物种类更是有近亿种之多。你是否想过,如何利用近年来火到爆棚的人工智能技术实现物种的分类和识别?这背后涉大规模图像分类技术。 图像分类技术日趋成熟,ResNet网络在ImageNet数据集上的top5准确率已超过96%。然而,如何高效地完成百万类别甚至是更大规模的分类任务,则是一个极具挑战性的课题。

疫情加速百度人脸识别变革:戴口罩也能准确识别

女生的网名这么多〃 提交于 2020-03-23 23:39:56
3 月,跳不动了?>>> 疫情之下,口罩识别有多难,问问你的iPhone用户朋友就知道了。 在“刷脸时代”,戴口罩的人脸识别已然成为一个大问题。 传统的人脸识别算法,已经无法hold住这种大面积遮挡情况,主要难点有三: 一张口罩“封印”半张脸,直接丢失大量脸部特征; 短期内无法收集大量戴口罩人脸图像,算法训练难度大; 人脸识别系统包含检测、跟踪、识别等多个模块,对它们都会造成影响。 好消息是,AI工程师们逢山开路遇水搭桥,现在——戴口罩人脸识别——这座桥,已经搭好了,而且已经开放了。 ​ 来自百度视觉算法团队,技术方面自然也有保障。 不过,知其然最好还要知其所以然。如此模型,百度视觉算法团队是如何完成的呢? 接下来我们一一解密。 戴口罩人脸识别之难:如何快准狠 “三座大山”怎么翻? 首先是第一个难题,丢失了大量脸部特征,如何进行检测。 在人脸识别的过程中,会提取面部大量的特征点,而这些特征点的分布并不都是均匀的。 而且每个区域特征点所包含的信息量(用于身份认证)不同,例如,眼部区域就相比其他位置包含了更多的身份信息。 ​ 百度视觉就敏锐地观察到了这一点,找到了翻过这座大山的突破口。 他们通过采用基于空间位置的注意力机制特征学习,让算法更加关注对眼部区域的特征学习。 基于空间位置的注意力机制特征学习 这样一来,就能将因为佩戴口罩、帽子等遮挡,所带来的信息丢失降到最低

疫情加速百度人脸识别变革:戴口罩也能准确识别,iPhone可以抄作业了

老子叫甜甜 提交于 2020-03-23 17:18:23
3 月,跳不动了?>>> 疫情之下,口罩识别有多难,问问你的iPhone用户朋友就知道了。 在“刷脸时代”,戴口罩的人脸识别已然成为一个大问题。 传统的人脸识别算法,已经无法hold住这种大面积遮挡情况,主要难点有三: 一张口罩“封印”半张脸, 直接丢失大量脸部特征 ; 短期内无法收集大量戴口罩人脸图像, 算法训练难度大 ; 人脸识别系统包含检测、跟踪、识别等多个模块,对它们都会造成影响。 好消息是,AI工程师们逢山开路遇水搭桥,现在——戴口罩人脸识别——这座桥,已经搭好了,而且已经 开放 了。 来自百度视觉算法团队,技术方面自然也有保障。 不过,知其然最好还要知其所以然。 如此模型,百度视觉算法团队是如何完成的呢? 接下来我们一一解密。 戴口罩人脸识别之难: 如何快准狠 “三座大山”怎么翻? 首先是第一个难题,丢失了大量脸部特征,如何进行检测。 在人脸识别的过程中,会提取面部大量的特征点,而这些特征点的分布并不都是均匀的。 而且每个区域特征点所包含的信息量(用于身份认证)不同,例如,眼部区域就相比其他位置包含了更多的身份信息。 百度视觉就敏锐地观察到了这一点,找到了翻过这座大山的突破口。 他们通过采用基于空间位置的注意力机制特征学习,让算法更加关注对眼部区域的特征学习。 基于空间位置的注意力机制特征学习 这样一来,就能将因为佩戴口罩、帽子等遮挡,所带来的信息丢失降到最低

飞桨重磅升级:支持千万规模分类任务训练,部署能力全面提升

北战南征 提交于 2020-03-03 16:59:07
2020 年 2 月 27 日飞桨核心框架(以下简称Paddle)发布了1.7版本,这也是Paddle在2020年首个重大更新,下面让我们来看看具体的更新内容。 Paddle 1.7版本对框架功能层面进行了重点增强,预测部署能力全面提升,分布式训练发布PLSC支持千万规模分类任务,并对参数服务器模式进行了优化整合。对编译选项、编译依赖以及代码库进行了全面清理优化。模型库持续完善,优化了整体层次结构,增加了动态图模型实现。端到端开发套件和工具组件进一步完善。 训练框架 增加自动混合精度训练AMP接口和新控制流接口。 优化Tensor使用方式和显存分配策略。 新增支持NVIDIA DALI GPU数据预处理库。 持续优化基础OP的功能和性能。 动态图的功能进一步完善,性能大幅提升,对Data Independent的动态图模型提供转为静态图可预测部署模型的功能。 框架调试分析功能和易用性全面提升。 预测部署 服务器端预测库的Python API大幅优化,新增R语言、Go语言的预测API,并增加相关的使用方法和示例,强化了量化支持能力。 Paddle Lite支持无校准数据的训练后量化方法生成的模型,加强对OpenCL的支持,支持昆仑XPU的预测。 模型压缩库PaddleSlim重构裁剪、量化、蒸馏、搜索接口,与模型库充分打通,新增大规模可扩展知识蒸馏框架Pantheon。 分布式训练