cvpr

Computer Vision Tutorials from Conferences (3) -- CVPR

你。 提交于 2020-03-18 04:42:03
CVPR 2013 ( http://www.pamitc.org/cvpr13/tutorials.php) Foundations of Spatial Spectroscopy James Coggins (ViaSat) https://sites.google.com/site/spatialspectroscopy/ pdf file not found, see talk videos here: http://techtalks.tv/events/315/599/ Large-scale visual recognition Florent Perronnin (XEROX), Zaid Harchaoui (INRIA), Herve Jegou (INRIA) https://sites.google.com/site/lsvr13/ https://sites.google.com/site/lsvr13/home/part-i-features-for-large-scale-visual-recognition/lsvr13_perronnin_features.pdf?attredirects=0&d=1 https://sites.google.com/site/lsvr13/home/part-ii-efficient-matching

CV codes代码分类整理合集(http://www.sigvc.org/bbs/thread-72-1-1.html)

匆匆过客 提交于 2020-03-14 03:46:09
一、特征提取Feature Extraction: SIFT [1] [ Demo program ][ SIFT Library ] [ VLFeat ] PCA-SIFT [2] [ Project ] Affine-SIFT [3] [ Project ] SURF [4] [ OpenSURF ] [ Matlab Wrapper ] Affine Covariant Features [5] [ Oxford project ] MSER [6] [ Oxford project ] [ VLFeat ] Geometric Blur [7] [ Code ] Local Self-Similarity Descriptor [8] [ Oxford implementation ] Global and Efficient Self-Similarity [9] [ Code ] Histogram of Oriented Graidents [10] [ INRIA Object Localization Toolkit ] [ OLT toolkit for Windows ] GIST [11] [ Project ] Shape Context [12] [ Project ] Color Descriptor [13] [ Project ] Pyramids

我如何在计算机视觉顶级会议CVPR上发表论文?[转]

点点圈 提交于 2020-02-11 17:09:10
Scalers 点评: 两个月前,成长会的Ramon(S290)收到了计算机视觉顶级会议CVPR论文录取的通知,而且是口头报告。CVPR在计算机视觉领域属于三大顶级会议之一,具有较高的影响力,对于一名在校博士生,能在这个会议上能发表论文,是很不错的一件事情。于是我请Ramon特意撰文,分享了这篇论文从想法到获得成果的一路历程。这篇文章比较长,但是却让我感慨良多。一方面让我想到自己在读研究生期间的经历,科研的生活仿佛历历在目;另外一方面,里面那段关于熬夜赶论文,不到截止不停工的精神,自己也是感同身受。正是因为在科研领域许许多多研究人员夜以继日的持续投入,才能有我们信息领域的科技发展。 另外还要说的一点是,Ramon也是成长会 机器学习 小组组长。我们机器学习小组最近完成了Stanford的在线机器学习课程,下一步即将启动 深度学习 的任务,如果你对这一领域有兴趣,欢迎来参加。详细情况参见 ScalersTalk 成长会深度学习研习计划招募启动 以往机器学习小组日志参见 ScalersTalk 成长会机器学习小组第10~11周学习笔记 ScalersTalk成长会机器学习小组第9周学习笔记 首先做一个自我介绍,我是Ramon(公众号RamonsVoice),中山大学在读博士生(直博第五年),2013年到2014年间在香港理工大学计算学系交流访问。主要的研究方向为计算机视觉

2019 CVPR论文调研 [1]

僤鯓⒐⒋嵵緔 提交于 2020-02-02 04:00:18
这周,我读了一些文章,但是基本上是以读摘要和介绍为主的,所以只能算得上是一种对当前趋势的调研,调研的文章主题主要是:Few-shot Tracking 以及 Unsupervised learning,最近瘟疫流行,在家里也做不了其他的,主要就是了解趋势 以及补充一些数学知识了,在搞定PRML,花书和CMU的那套Lecture后,应该会出一下PRML的课后习题每周更新(这个如果有私信的话,我考虑下要不要在B站发下习题视频,应该会和matrix cookbook一起讲吧,感觉是个大坑),不说闲话,先说下这几片论文。 接下来将以题目;文章提出的问题是什么,为什么,怎么做这几点来阐述每一篇文章,最后附上文章链接,有代码的话也会附在最后面,没有代码的,可以根据作者信息去向作者礼貌点要代码。 关键词:Few-shot ; Tracking ; Unsupervised learning; Unsupervised learning of action classes with continuous temporal embedding 问题: 如果我们给一个没有经过任何修剪的视频(视频中间没有忽然间切换),我们能不能通过无监督学习的方法识别出视频当中的动作,并且成功的给视频分片。(当然对于动作的定义还是人给的) 为什么: 这些年来视频中的动作识别已经相当成功了

知乎-如何rebuttal

天大地大妈咪最大 提交于 2020-01-31 00:34:24
作者:魏秀参 链接:https://zhuanlan.zhihu.com/p/104298923 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 学术论文是发布自己或团队最新研究进展正式且最快捷的途径,也是和同行交流想法最方便、高效的方式。当同行评议(Peer review)作为学术成果正式发布的必经之路已运行200余年 [1] 时,用正确的姿势进行review rebuttal便成为提高论文录用机率甚至扭转乾坤的最后一搏。本文从“What is peer review?”、“How to rebuttal?”及“Does rebuttal matter?”三部分来聊聊学术论文(主要针对人工智能领域会议和期刊)rebuttal的那些事。 What is peer review? 要想写好rebuttal,必然要先了解peer review是怎么一回事。 “Peer review”趣图(原图来自网络) Peer review是一种学术成果审查程序,即作者的学术著作或proposal被同一领域的其他专家学者评审,并根据评审意见决定是否予以录用(Accept)和后续正式发表(Publish)。对于计算机学科特别是人工智能领域的学术会议和期刊,其均有相对成熟和流程化的同行评议(即审稿)机制。 【会议审稿】 对于会议审稿流程而言

CVPR 2018 | 商汤科技论文详解:基于空间特征调制的图像超分辨率(很重要!!语义信息加入进去)

此生再无相见时 提交于 2020-01-11 12:48:38
在底层视觉算法领域,商汤科技提出的 面向生成更自然真实纹理图像的超分辨率算法 。本文为商汤科技CVPR 2018论文解读第3期。 论文:Recovering Realistic Texture in Image Super-resolution by Deep Spatial Feature Transform 作者:Xintao Wang, Ke Yu, Chao Dong, Chen Change Loy 论文链接: https:// arxiv.org/abs/1804.0281 5 Project page: http:// mmlab.ie.cuhk.edu.hk/pr ojects/SFTGAN/ 简介 单帧图像超分辨率旨在基于单张低分辨率图像恢复对应的高分辨率图像。卷积神经网络近年在图像超分辨率任务中表现出了优异的重建效果,但是恢复出自然而真实的纹理依然是超分辨率任务中的一大挑战。 如何恢复出自然而真实的纹理呢?一个有效的方式是考虑语义类别先验,即使用图像中不同区域所属的语义类别作为图像超分辨率的先验条件,比如天空、草地、水、建筑、森林、山、植物等。不同类别下的纹理拥有各自独特的特性,换句话说,语义类别能够更好的约束超分辨中同一低分辨率图存在多个可能解的情况。如图1中展示的建筑和植物的例子,它们的低分辨率图像块非常类似。虽然结合生成对抗式网络(GAN)进行超分复原

A Geodesic-Preserving Method for Image Warping

余生长醉 提交于 2020-01-01 00:38:31
A Geodesic-Preserving Method for Image Warping http://kaiminghe.com/ http://openaccess.thecvf.com/content_cvpr_2015/supplemental/Li_A_Geodesic-Preserving_Method_2015_CVPR_supplemental.pdf http://www.doc88.com/p-1466984314462.html 常用投影及转换介绍 https://www.it610.com/article/4746922.htm Correct volume deformation https://www.dxo.com/dxo-viewpoint/features/ 来源: CSDN 作者: hjwang1 链接: https://blog.csdn.net/hjwang1/article/details/103772876

笔记七.CVPR目标检测论文阅读ScratchDet: Training Single-Shot Object Detectors from Scratch

冷暖自知 提交于 2019-12-22 15:19:27
一.背景问题 目前在数据集ImageNet上预训练现成网络,再进行微调,存在的问题: 1)分类和检测任务对目标位置有不同程度的敏感度,导致最终学习目标产生偏差; 2) 该体系结构受分类网络的限制,给修改带来不便。 为了解决这些问题,从零开始训练探测器是一个可行的解决方案。 通过大量的实验和对下采样因子的分析,提出了一种充分利用原始图像信息的root-ResNet骨干网。 我们的ScratchDet在所有从头开始的训练检测器中,在PASCAL VOC 2007、2012和MS COCO上都达到了最先进的精度,甚至比几种一级预处理方法性能更好。 代码:https://github.com/kimsoyone/ScratchDet。 二.论文解决 因此,要想从零开始利用训练检测器,需要实现两个方面的改进: (1)在保证训练收敛性的同时,不受任何类型网络的体系结构限制; (2)使训练检测器的性能与预训练网络一样好(甚至更好)。 本文的主要贡献概括如下: (1) 我们提出了一种从零开始训练的单阶段目标检测器ScratchDet,它集成了BatchNorm以帮助检测器从零开始很好地收敛,独立于网络类型。 (2)提出了一种新的root-ResNet骨干网,显著提高了检测精度,特别是对小目标的检测。 (3) ScratchDet的性能优于最先进的从头开始的训练检测器和一些基于预训练的检测器。 三

语义分割算法之CVPR 2017 RefineNet(精度高且对稠密物体分割效果好,已开源)

南笙酒味 提交于 2019-12-18 09:32:46
前言 前面介绍了很多目标检测的算法,为了平衡一下,今天介绍一个语义分割算法QAQ。这是来自CVPR 2017的RefineNet,在PSCAL VOC 2012上达到了83.4的mIOU,是一个非常优秀的网络,同时其论文的思想也能对我们做工程做学术给予启发,我们来一起看看吧。对了,说一句题外话,卷积神经网络系列已经更新了5篇,接下来打算更新20篇左右从2012年到现在非常经典的CNN网络,一起来学习CNN呀。这篇论文的地址见附录。 背景 当前流行的CNN如VGG,ResNet等由于池化层和卷积步长的存在,特征图分辨率越来越小,导致损失了一些细节信息,我们在 卷积神经网络学习路线(一)| 卷积神经网络的组件以及卷积层是如何在图像中起作用的? 介绍过低层的特征图有丰富的细节信息,而高层特征图则有更加抽象的语义信息。对于分类问题来说,只要高级语义信息足够强,模型就能表现得好。而对于稠密预测如逐像素的语义分割问题来说,除了高级语义特征之外,还需要低层的细节信息。针对这一问题,有很多方法被提出。例如以SegNet结构为典型的编解码结构,使用反卷积来恢复图像分辨率,但却依然很难恢复细节信息。还有Unet为代表的使用跳跃连接来产生高分辨率的预测。以及DeepLab系列使用空洞卷积保持分辨率,增大感受野,但这种做法增加了计算量,并且空洞卷积容易损失一些高层语义信息。 主要贡献 针对上面的背景

本人常用资源整理(ing...)

旧时模样 提交于 2019-12-17 20:28:09
Deep Learning(深度学习): ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):一 ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):二 Bengio团队的deep learning教程,用的theano库,主要是rbm系列,搞python的可以参考,很不错。 deeplearning.net主页,里面包含的信息量非常多,有software, reading list, research lab, dataset, demo等,强烈推荐,自己去发现好资料。 Deep learning的toolbox,matlab实现的,对应源码来学习一些常见的DL模型很有帮助,这个库我主要是用来学习算法实现过程的。 2013年龙星计划深度学习教程,邓力大牛主讲,虽然老师准备得不充分,不过还是很有收获的。 Hinton大牛在coursera上开的神经网络课程,DL部分有不少,非常赞,没有废话,课件每句话都包含了很多信息,有一定DL基础后去听收获更大。 Larochelle关于DL的课件,逻辑清晰,覆盖面广,包含了rbm系列,autoencoder系列,sparse coding系列,还有crf,cnn,rnn等 。 虽然网页是法文,但是课件是英文。 CMU大学2013年的deep learning课程,有不少reading