PaddlePaddle

百度 PaddlePaddle开源视频分类模型Attention Cluster,曾夺挑战赛冠军

人盡茶涼 提交于 2021-02-18 00:06:39
Attention Cluster 模型 视频分类问题在视频标签、监控、自动驾驶等领域有着广泛的应用,但它同时也是计算机视觉领域面临的一项重要挑战之一。 目前的视频分类问题大多是基于 CNN 或者 RNN 网络实现的。众所周知,CNN 在图像领域已经发挥了重大作用。它具有很好的特征提取能力,通过卷积层和池化层,可以在图像的不同区域提取特征。RNN 则在获取时间相关的特征方面有很强的能力。 Attention Cluster 在设计上仅利用了 CNN 模型,而没有使用 RNN,主要是基于视频的以下几个特点考虑: 图 1 视频帧的分析 首先,一段视频的连续帧常常有一定的相似性。在图 1(上)可以看到,除了击球的动作以外,不同帧几乎是一样的。因此,对于分类,可能从整体上关注这些相似的特征就足够了,而没有必要去特意观察它们随着时间的细节变化。 其次,视频帧中的局部特征有时就足够表达出视频的类别。比如图 1(中),通过一些局部特征,如牙刷、水池,就能够分辨出『刷牙』这个动作。因此,对于分类问题,关键在于找到帧中的关键的局部特征,而非去找时间上的线索。 最后,在一些视频的分类中,帧的时间顺序对于分类不一定是重要的。比如图 1(下),可以看到,虽然帧顺序被打乱,依然能够看出这属于『撑杆跳』这个类别。 基于以上考虑,该模型没有考虑时间相关的线索,而是使用了 Attention 机制

究极全面炼丹教程,使用PaddleOCR并自己训练模型,太上老君看了都说好

筅森魡賤 提交于 2021-01-25 11:05:29
使用PaddleOCR,训练自己的模型 前言______PaddleOcr的安装与准备工作 资料准备 1. 下载icdar2015图片集 2. 下载icdar2015数据集配套的标注文件 3.组织数据集路径 4.下载预训练模型 5.组织预训练模型路径 6.修改配置文件 ~~设置完成,开始训练~~ 到了紧张刺激的DEBUG环节才对 如何制作自己的数据集? 模型评估与模型检查 ps:为方便读者文章中需要用到的文件均使用我的网盘分享下载,同时也会给出官网下载地址 前言______PaddleOcr的安装与准备工作 1.PaddleOcr相关组件安装我在上一个博客中已经介绍完毕→ PaddleOcr安装与使用全程指南 ←点击跳转 2.下载PaddleOcr官方文件包, https://kyc592.lanzous.com/i5C7Gkojm7c 密码:kyc 或官网下载地址:https://gitee.com/paddlepaddle/PaddleOCR 然后解压到项目文件夹的根目录下。 一定确保按照前一篇博客操作完毕,Paddleocr可以正常运行,尽量减少待会出现的极 其 繁 重的debug工作。 至此完成准备工作。 资料准备 训练自己的模型,需要的资料有: ①训练用的图片集 ②测试用的图片集 ③前面两个图片集配套的标注文件 ④预训练模型 1. 下载icdar2015图片集 演示采用的

手写数字识别

泪湿孤枕 提交于 2021-01-06 16:57:17
本文作者:馬立 分享嘉宾:白浩杰 文章整理:马立辉 内容来源:百度云智学院 导读 上篇文章,我们重点讲解了卷积神经网络的基本概念及结构。本篇,我们将进行代码实战——完成手写数字识别任务。 本次实验代码是基于百度的深度学习框架—— 飞桨( PaddlePaddle )。 本篇文章主要内容包括: 1.创建实验资源 2.项目实战 3.总结 1. 创建实验资源 本次实验将在 百度云智学院实验平台 上进行,该平台已经为大家准备好实验所需环境。实验前,我们需要 创建实验资源 ,步骤如下: 《手写数字识别项目实战》地址为: http://abcxueyuan.cloud.baidu.com/newlab/#/lab_detail/lab_simple_say?id=116 打开该网址进入如下页面,点击: 开始学习 。在弹出的页面中点击 创建资源。 创建资源完成后点击 进入实验 。按以下步骤操作: 步骤一: 步骤二: 步骤三: 步骤四: 步骤五: 按照上述步骤完成实验资源的创建后,便可开始进行实验。 2. 项目实战 2.1 数据集介绍 当我们学习编程的时候,编写的第一个程序一般是打印出"Hello World"。而机器学习(或深度学习)的入门实验,一般是完成MNIST数据集上的手写数字识别任务。原因是手写数字识别属于典型的图像分类任务,比较简单。同时MNIST数据集也很经典

深度学习的一些经验总结和建议| To do v.s Not To Do

女生的网名这么多〃 提交于 2020-12-23 04:22:11
每天进步一点点,关注&置顶“ 我爱计算机视觉 ” CV君:本文作者为百度 PaddlePaddle 组技术布道师Charlotte77,内容全是实战经验的精炼总结,强烈推荐大家收藏。 除了列出来的内容,各位读者有什么独门秘籍也欢迎文末留言分享!截止到明晚23点(7月22日),留言被点赞最多的深度学习绝招,联系CV君(文末扫码)发50元红包! 昨天看到几篇不同的文章写关于机器学习的to do & not to do,有些观点赞同,有些不赞同,是现在算法岗位这么热门,已经不像几年前一样,可能跑过一些项目、懂点原理就可以了,现在对大家的要求更高,尤其工程能力更不可缺少,只跑过一些iris鸢尾花分类、啤酒与尿布、猫狗分类等的同学需要再提高提高,因为竞争太激烈了, 我在这里结合我自己的经验 总结一下 吧~ To Do 做项目时,边搜集数据可以边用已经搜集好的 少部分数据跑模型 。不用等到所有数据都搜集好了再跑。 不知道什么算法合适,可以直接把所有的算法都跑一遍,看效果再选择,多跑几个应用场景你就知道什么算法适合什么场景,什么数据对不同的算法会有什么影响了。 不知道什么参数是最佳参数,可以用random search或者grid search自动搜索最佳参数组合,有经验以后对于每个参数的大概范围心里会有个数。 一定要练习工程能力,只会调参的demo侠现在很难找到工作啦。 模型复现和刷题

【AI】PaddlePaddle-Docker运行

╄→尐↘猪︶ㄣ 提交于 2020-12-18 06:33:36
1、参考官方安装Docker环境,使用一键安装包安装 https://www.jianshu.com/p/b2766173d754 http://www.paddlepaddle.org/documentation/docs/zh/1.1/beginners_guide/install/install_Windows.html 2、运行第一个例子housing可能会出现housing.data例子下载不了,需要下载之后拷贝到docker环境的指定目录 docker cp D:\housing.data 71afc03dc882:/root/ docker attach 71afc03dc882 mv housing.data /root/.cache/paddle/dataset/uci_housing/ python housing.py 3、使用docker直接拉取paddlepaddle镜像,在jupyter之中运行house.py docker run -p 8888:8888 paddlepaddle/book docker pull paddlepaddle/paddle docker pull docker.paddlepaddlehub.com/paddle 该镜像比较大,近3G。 在IE中打开浏览器 4 运行 docker run -it --rm docker

大佬云集!百度NLP-ERNIE团队招聘算法小伙伴啦!

戏子无情 提交于 2020-11-19 02:52:16
来百度NLP-文心(ERNIE)团队做 最强 的预训练,发 最好 的 paper,支持 最核心 的业务(搜索、广告),做三项全能的 NLP 弄潮儿。 我们是负责百度NLP语义理解技术与平台文心(ERNIE) 研发团队。 ERNIE 致力于预训练语义理解技术研发与应用,提升NLP任务效果,深度支持百度核心业务线。 近一年来,文心( ERNIE )取得多项荣誉: 2019年12月,我们首次突破 90 分大关登顶通用语言理解评估基准GLUE; 2020年1月,我们提出的预训练语言生成技术 ERNIE -GEN 在多个语言生成任务取得 SOTA; 2020年3月,我们在 SemEval-2020 上取得了5项世界冠军; 2020年7月,我们提出的多模态语义理解技术 ERNIE -ViL登顶视觉常识推理权威榜单VCR; 2020年7月9日,我们荣获2020世界人工智能大会最高奖。 在这里,你可以利用中国自主研发的 飞桨 ( PaddlePaddle )深度学习平台,进行高效的多机多卡训练,千亿级别的数据等待你的挖掘。这里有良好的团队氛围和资深、耐心的指导人带你探索新一代NLP技术。在这里,我们在使用业界领先的预训练语言理解技术提升真实工业场景的应用效果。 现在,我们在招人。 欢迎应届毕业 1~2 年的同学(社招)投递简历 (校招同学也可以转简历喔), base 北京 。 工作职责

Python读懂你的心

家住魔仙堡 提交于 2020-11-03 14:01:22
Python读懂你的心 一、前言 人工智能是Python语言的一大应用热门,而自然语言处理又是人工智能的一大方向。自然语言处理( natural language processing )简称NLP,是研究人同计算机之间用自然语言通信的一种方法。我们都知道,计算机本质上只认识0和1,但是通过编程语言我们可以使用编程语言同计算机交流。这实际上就是程序员同计算机之间的通信,而我们日常生活中使用的是自然语言,是一种带有情感的语言。那么要怎么使计算机理解这种带有情感的语言呢?这就是自然语言处理研究的内容了。 语言的情绪识别是自然语言处理的一种操作,如果要我们从0开始实现情绪识别是比较繁琐的。首先我们需要准备好足够的数据,为了让计算机更好的理解,我们还需要对数据进行预处理,之后需要训练数据,有了训练数据我们才能开始情绪识别。识别的准确率在于数据的相关性和数据量,数据相关性越高,数据量越大,识别的准确率就越高。 然而,我们使用 paddlehub 可以很快的实现情绪识别,我们先看看如何安装。 二、安装 paddlehub paddlehub 是百度 飞桨 PaddlePaddle 中的一个模型库,使用 paddlepaddle 可以很快的实现多种多样的操作,其中就有我们今天要说到的文字情绪识别,而且代码非常简单。首先我们需要安装 paddlepaddle ,我们进入官网 https://www

11月04日直播 | 60分钟玩转 PaddleOCR Java部署

妖精的绣舞 提交于 2020-11-02 18:46:29
双十一买买买后悔了,退货时,拍下快递单就能自动填充单号; 出国旅游时,拍下菜单上的英语菜名,屏幕上实时显示出翻译好的中文菜名; 拍下名片信息就能自动归类,将名片信息自动保存到通讯录相应的信息中; 拍下题目就能得到答案,在家轻松获得作业辅导…… 这些场景的背后,离不开一项共同的关键技术——光学字符识别(Optical Character Recognition,OCR)。 包括我们现在习以为常的身份证识别、护照识别、行驶证识别、发票识别、文档识别、营业执照识别......如今,OCR 技术在人们的生活与工作中早已得到了广泛的普及,不仅帮助人们减少了工作量,也再一次解放了人们的双手。 如果你对 OCR 技术与其应用部署充满好奇,一定不要错过本周三晚上 飞桨 开发者说直播间,从前沿技术到模型应用,为你揭开 OCR 技术背后的那些事。 直播时间 11月04日(本周三)19:00-20:00 直播地址 本次直播将在「 飞桨 PaddlePaddle 」B 站直播间进行直播,直播地址: http://live.bilibili.com/21689802 扫码加入直播交流群,与讲师互动,并有机会获得精美礼品哟 PPDE 飞桨 开发者说 Live 每周三晚上 19:00-20:00, 都有一位PPDE( PaddlePaddle Developers Experts)在B站与大家见面交流

全球对话技术顶赛DSTC9落幕,百度NLP开源PLATO-2斩获四项冠军

会有一股神秘感。 提交于 2020-10-31 09:50:21
  机器之心发布    机器之心编辑部    全球人工智能学术竞赛 DSTC 是对话系统技术领域的顶级赛事。2020 年度第九届国际对话技术竞赛 DSTC9 共设有 4 个赛道 (Track-1~Track-4),主办方包括 Facebook、亚马逊、微软、卡内基梅隆大学、清华大学等,参与者广泛覆盖了企业和高校的参赛团队。   近期 DSTC9 官方陆续公布各个赛道排名。百度参与了 DSTC9 前 3 个赛道中 4 项任务的角逐,并在最终的榜单中拔得头名,成绩令人瞩目。这些赛道全面涵盖了开放域闲聊、知识对话、任务型对话等关键问题。据悉,百度在这些任务中所使用的核心技术,均基于其最近开源的开放域对话模型 PLATO-2。   PLATO-2 是基于隐空间技术的大规模开放域对话模型,参数规模高达 16 亿,可就开放域话题深度畅聊,在中英文效果上,已全面超越 Google Meena、Facebook Blender、微软小冰等先进模型。PLATO-2 采用了课程学习进行训练,其过程包括两个阶段:第一阶段,基于简化的 “一对一” 映射,训练得到基础的回复生成模型;第二阶段包含生成 - 评估两个模型,针对开放域对话的 “一对多” 问题,通过引入离散隐变量进行建模,训练得到更高质量的回复生成模型,同时训练评估模型,从多个候选中选择出最合适的回复。这种框架具有很强的通用能力

1024程序员节开源技术英雄会,参会“英雄榜”发榜

随声附和 提交于 2020-10-25 04:54:46
10月23-26日,由CSDN等多家单位精心筹划的“长沙 · 中国1024程序员节”将盛大举行。程序员节活动以开源为主议题,包括2场岳麓尖峰对话;2020开源技术英雄大会;10+场热门技术分论坛/峰会;创意集市;体验感超强的科技文化嘉年华、最HIGH时刻的开源之夜。内容聚焦开源技术及生态建设、操作系统及硬件创新、开源社区及商业化发展等多个重要话题。 尤其是此次重磅推出的“开源技术英雄会”,将以2020中国开源技术英雄的年度大聚会为核心,重磅邀请卓越的开源技术领袖和贡献者齐聚长沙,以“洞悉开源新变量”为主题,展开主题演讲与深度讨论。开源英雄群英荟萃,2020开源技术英雄会,必将成为一场交流真知灼见的开源生态大会。 CSDN作为中国专业的开发者社区,将联手多家单位,广发英雄帖,汇聚国内顶级开源英雄、开源项目、开源企业,共谱硬核科技与开源文化大图谱。 百余位开源英雄齐聚 , 岳麓山下技术“过招” 当前科技的发展,打造中国自主可控的开源生态,尤其是核心技术栈和开源生态系统,势在必行。藉由1024程序员节的召开,100余位卓越技术英雄齐聚“2020开源技术英雄会”,他们带来武功秘籍,在岳麓山下分享技术洞见,切磋过招! 最终出席嘉宾以现场为准 2020开源技术英雄会汇聚了来自学术界的顶尖学者、知名开源社区的领军人物,以及华为、阿里、百度、腾讯、滴滴、中科创达、海尔等顶尖企业