pyramid

从经典到最新前沿,一文概览2D人体姿态估计

烈酒焚心 提交于 2020-08-04 19:32:40
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 作者:谢一宾 | 来源:知乎 https://zhuanlan.zhihu.com/p/140060196 本文仅做学术分享,如有侵权,请联系删除。 前言 本文主要讨论2D的人体姿态估计,内容主要包括:基本任务介绍、存在的主要困难、方法以及个人对这个问题的思考等等。希望大家带着批判的目光阅读这篇文章,和谐讨论。 介绍 2D人体姿态估计的目标是定位并识别出人体关键点,这些关键点按照关节顺序相连,就可以得到人体的躯干,也就得到了人体的姿态。 在深度学习时代之前,和其他计算机视觉任务一样,都是借助于精心设计的特征来处理这个问题的,比如pictorial structure。凭借着CNN强大的特征提取能力,姿态估计这个领域得到了长足的发展。2D人体姿态估计主要可以分为单人姿态估计(Single Person Pose Estimation, SPPE)和多人姿态估计(Multi-person Pose Estimation, MPPE)两个子任务。 单人姿态估计是基础,在这个问题中,我们要做的事情就是给我们一个人的图片,我们要找出这个人的所有关键点,常用的MPII数据集就是单人姿态估计的数据集。 在多人姿态估计中,我们得到的是一张多人的图,我们需要找出这张图中的所有人的关键点。对于这个问题,一般有自上而下(Top-down

SQLAlchemy: order by a relationship field in a relationship

百般思念 提交于 2020-07-20 07:36:12
问题 In a Pyramid application I'm working on, I have the following scenario: class Widget(Base): __tablename__ = 'widgets' id = Column(Integer, primary_key=True) name = Column(String(50)) sidebar = Column(mysql.TINYINT(2)) def __init__(self, name, sidebar): self.name = name self.sidebar = sidebar class Dashboard(Base): __tablename__ = 'dashboard' user_id = Column(Integer, ForeignKey('users.id'), primary_key=True) widget_id = Column(Integer, ForeignKey('widgets.id'), primary_key=True) delta =

论文列表——text classification

萝らか妹 提交于 2020-05-07 18:33:45
https://blog.csdn.net/BitCs_zt/article/details/82938086 列出自己阅读的text classification论文的列表,以后有时间再整理相应的笔记。阅读价值评分纯粹是基于自己对于文章的理解,标准包括:动机、方法、数据集质量、实验安排、相关工作等,满分为5。列表如下: 名称 所属会议 类型 时间 阅读价值 Recurrent Convolutional Neural Networks for Text Classification AAAI long paper 2015 4.5 Do Convolutional Networks need to be Deep for Text Classification ? AAAI 2017 work shop 4.5 Learning Structured Representation for Text Classification via Reinforcement Learning AAAI 2018 long paper 4 Enriching Word Vectors with Subword Information ACL 2017 long paper 4 Deep Pyramid Convolutional Neural Networks for Text

FAIR开源Detectron:整合全部顶尖目标检测算法

霸气de小男生 提交于 2020-05-07 14:02:39
昨天,Facebook AI 研究院(FAIR)开源了 Detectron,业内最佳水平的目标检测平台。 昨天,Facebook AI 研究院(FAIR)开源了 Detectron,业内最佳水平的目标检测平台。据介绍,该项目自 2016 年 7 月启动,构建于 Caffe2 之上,目前支持大量机器学习算法,其中包括 Mask R-CNN(何恺明的研究,ICCV 2017 最佳论文)和 Focal Loss for Dense Object Detection,(ICCV 2017 最佳学生论文)。Facebook 称,该工具包已被应用与公司内部很多团队应用于各类应用中,一旦训练完成,这些计算机视觉模型可被部署在云端或移动设备上。 项目地址:https://github.com/facebookresearch/Detectron Detectron Detectron 是 Facebook AI Research 实现顶尖目标检测算法(包括 Mask R-CNN)的软件系统。该系统是基于 Python 和深度学习框架 Caffe 2 而构建的。 在 FAIR 实验室,Detectron 目前已经支持很多研究项目的实现,包括: Feature Pyramid Networks for Object Detection (https://arxiv.org/abs/1612.03144

SPP原理和代码

旧街凉风 提交于 2020-05-05 11:03:13
空间金字塔池化(Spatial Pyramid Pooling, SPP)原理和代码实现(Pytorch) 一、为什么需要SPP 首先需要知道为什么需要SPP。 我们都知道卷积神经网络(CNN)由卷积层和全连接层组成,其中卷积层对于输入数据的大小并没有要求,唯一对数据大小有要求的则是 第一个全连接层 ,因此基本上所有的CNN都要求输入数据固定大小,例如著名的 VGG模型 则要求输入数据大小是 (224*224) 。 固定输入数据大小有两个问题: 很多场景所得到数据并不是固定大小的,例如街景文字基本上其高宽比是不固定的,如下图示红色框出的文字。 2.可能你会说可以对图片进行切割,但是切割的话很可能会丢失到重要信息。 综上,SPP的提出就是为了解决CNN输入图像大小必须固定的问题,从而可以使得输入图像高宽比和大小任意。 二、SPP原理 更加具体的原理可查看原论文: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 上图是原文中给出的示意图,需要从下往上看: 首先是输入层(input image),其大小可以是任意的 进行卷积运算,到最后一个卷积层(图中是conv5)输出得到该层的特征映射(feature maps),其大小也是任意的 下面进入SPP层

【PathTracing】虚幻四中针对体素进行优化的基于SV(Voxel)GF的实时光线追踪

↘锁芯ラ 提交于 2020-05-03 16:31:44
写在前面: 本文将分享我在UE4中使用蓝图复现SVGF [1] (的Voxel改版)的流程。 本文将首次放出项目(可以算是开源,写得不好还请见谅)。而且不会有太多的公式,涉及的方面虽然很多但是其实在我之前的文章里都有提到。只描述这个项目是怎么用蓝图来实现的。 项目包含: 一个全蓝图和材质的光追器(包括BRDF,Pathtracing,体素求交), 一个体素化函数库(目前有点Bug但是基本不影响使用), 一个体素操作函数库 一个蓝图和材质实时去噪器。 没有额外的C++代码,全文基于蓝图。 项目写成不容易,能多点赞请多点赞。 PS:本人准备以后转到b站,在白嫖(不是)之前,关注我的b站账号并三连吧~(我会尽量更新视频/教程),项目链接也会放在b站的视频下方: 【虚幻4】基于CBR和SVGF的实时体素光线追踪_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili ​ www.bilibili.com 时间隔得比较久,实现及描述上可能会有疏漏,还请各位斧正。 目录 一、管线概述 1.GBuffer(VoxelBuffer) 2.Raytrace 3.Upsampling 4.Atrous Filtering 5.Temporal AA 6.其他(包括数据的准备) 1.Pingpong 2.体素 二、棋盘格与Upsampling 1.棋盘格 2.Upsampling 三、SV(Voxel)GF

PyramidBox

别说谁变了你拦得住时间么 提交于 2020-04-23 04:50:22
PyramidBox https://github.com/aspxcor/Pyramidbox-Based-Head-Recognition/tree/master/PyramidBox-master 首先简单介绍了人脸检测的发展,SSH、S3FD通过设计具有尺度不变性的网络结构,在单个网络的各个特征金字塔上检测不同尺度的人脸。如何通过人脸的上下文信息(contextual information)来辅助人脸检测,一直是被忽略的方向,因为人脸一般都不会单独的存在与图像中,一般都会包含头、肩、身体等部位,当人脸由于遮挡、低分辨率、模糊等情形不容易被检测时,这些上下文的信息其实是可以辅助人脸检测的。本文的PyramidBox通过结合上下文信息,以辅助人脸检测。 1,提出PyramidAnchors,设计 contextual anchor 通过半监督的方法,来说学习高层特征的上下文信息,具体的,结合了人头,身体等信息,以检测出小尺度,模糊,遮挡的人脸。 2,设计了Low-Level Feature Pyramid Network(LFPN),联合合适的高层语义信息(不使用高层,而是中间feature map层)+低层feature map 特征。以检测所有尺度的人脸。这么做的出发点是作者认为大小尺度人脸所包含的信息量是不一样的,并非所有高层feature

语义分割丨PSPNet源码解析「训练阶段」

依然范特西╮ 提交于 2020-04-22 04:53:02
引言 之前一段时间在参与语义分割的项目,最近有时间了,正好把这段时间的所学总结一下。 在代码上,语义分割的框架会比目标检测简单很多,但其中也涉及了很多细节。在这篇文章中,我以PSPNet为例,解读一下语义分割框架的代码。搞清楚一个框架后,再看别人的框架都是大同小异。 工程来自 https://github.com/speedinghzl/pytorch-segmentation-toolbox 框架中一个非常重要的部分是evaluate.py,即测试阶段。但由于篇幅较长,我将另开一篇来阐述测试过程,本文关注训练过程。 整体框架 pytorch-segmentation-toolbox |— dataset 数据集相关 |— list 存放数据集的list |— datasets.py 数据集加载函数 |— libs 存放pytorch的op如bn |— networks 存放网络代码 |— deeplabv3.py |— pspnet.py |— utils 其他函数 |— criterion.py 损失计算 |— encoding.py 显存均匀 |— loss.py OHEM难例挖掘 |— utils.py colormap转换 |— evaluate.py 网络测试 |— run_local.sh 训练脚本 |— train.py 网络训练 train.py 网络训练主函数

sphinx 编写文档使用记录

百般思念 提交于 2020-04-19 18:39:21
目录 1、安装 sphinx 环境 2、生成 Sphinx 工程 配置主题和插件 3、编写并构建文档 1、安装 sphinx 环境 首先安装 python 环境 这里可以安装 anacond ,使用起来比较方便。参考: Anaconda的安装和详细介绍(带图文) 我这里直接使用 scoop 来安装。 # 安装 miniconda scoop install -g miniconda3 Installing 'miniconda3' (4.7.12.1) [64bit] Miniconda3-4.7.12.1-Windows-x86_64.exe (51.5 MB) [============================================================] 100% Checking hash of Miniconda3-4.7.12.1-Windows-x86_64.exe ... ok. Running installer... done. Linking C:\scoop\apps\miniconda3\current => C:\scoop\apps\miniconda3\4.7.12.1 Creating shim for 'python'. Creating shim for 'pythonw'. Creating shim for

7 Papers | 微软亚研麻将AI「Suphx」技术细节;港中文、商汤动作识别时序金字塔网络

て烟熏妆下的殇ゞ 提交于 2020-04-13 20:24:18
【今日推荐】:为什么一到面试就懵逼!>>> 本周的重要论文有微软麻将 AI 研究团队公布 Suphx 所有技术细节,以及港中文联合商汤科技推出的特征级通用时序金字塔网络。 目录: Background Matting: The World is Your Green Screen Suphx: Mastering Mahjong with Deep Reinforcement Learning A mountable toilet system for personalized health monitoring via the analysis of excreta Weakly-Supervised Reinforcement Learning for Controllable Behavior Evolving Normalization-Activation Layers Temporal Pyramid Network for Action Recognition Tracking Objects as Points ArXiv Weekly Radiostation:NLP、CV、ML更多精选论文(附音频) 论文 1:Background Matting: The World is Your Green Screen 作者:Soumyadip Sengupta