rcnn

Tensorflow版Faster RCNN源码解析(TFFRCNN) (15) VGGnet_train.py

徘徊边缘 提交于 2019-11-26 23:30:57
本blog为github上 CharlesShang/TFFRCNN 版源码解析系列代码笔记 --------------- 个人学习笔记 --------------- ---------------- 本文作者吴疆 -------------- ------ 点击此处链接至博客园原文 ------ 与VGGnet_test.py相比,VGGnet_train.py需要馈入更多的变量,与train.py中train_model(...)函数定义的feed_dict相照应,此外,还增加了name为rpn-data、roi-data、drop6和drop7的网络处理层, keep_prob 为dropout的比例 # train.py中train_model(...)函数定义的feed_dict feed_dict={ self.net.data: blobs['data'], self.net.im_info: blobs['im_info'], self.net.keep_prob: 0.5, self.net.gt_boxes: blobs['gt_boxes'], self.net.gt_ishard: blobs['gt_ishard'], self.net.dontcare_areas: blobs['dontcare_areas'] } VGGnet_train

Tensorflow版Faster RCNN源码解析(TFFRCNN) (13) gt_data_layer/roidb.py

╄→гoц情女王★ 提交于 2019-11-26 22:21:06
本blog为github上 CharlesShang/TFFRCNN 版源码解析系列代码笔记 --------------- 个人学习笔记 --------------- ---------------- 本文作者吴疆 -------------- ------ 点击此处链接至博客园原文 ------ 定义函数与roi_data_layer/roidb.py类似 1.prepare_roidb(imdb) 给imdb.roidb增加'info_boxes'字段信息,shape为N* 18,18表示(cx, cy, scale_ind, box, scale_ind_map, box_map, gt_label, gt_sublabel, target), 未见调用 get_boxes_grid(image_height, image_width) (由C编译)未知函数意义 为何imdb.roidb中既有gt roi又有一般的roi???ex_rois和gt_rois??? 默认 无 cfg.TRAIN.SCALE_MAPPING 值,将报错,该函数并未被执行 # 为imdb.roidb增加'info_boxes'字段信息 # 包含(cx, cy, scale_ind, box, scale_ind_map, box_map, gt_label, gt_sublabel,

Tensorflow版Faster RCNN源码解析(TFFRCNN) (11) gt_data_layer/minibatch.py

纵饮孤独 提交于 2019-11-26 16:13:17
本blog为github上 CharlesShang/TFFRCNN 版源码解析系列代码笔记 --------------- 个人学习笔记 --------------- ---------------- 本文作者吴疆 -------------- ------ 点击此处链接至博客园原文 ------ 与roi_data_layer/minibatch.py类似, 该函数可能并未执行 """Compute minibatch blobs for training a Fast R-CNN network.""" 1.get_minibatch(roidb, num_classes) 更新roidb[i]'info_boxes'字段( 未知内容,18是什么意思 )、增加'data'(图像数据blob)和'parameters'字段(相关参数,含num_scale 图像缩放尺度数量、num_aspect 使用纵横比数量、cfg.TRAIN.SCALES、 cfg.TRAIN.SCALE_MAPPING、cfg.TRAIN.ASPECT_HEIGHTS、cfg.TRAIN.ASPECT_WIDTHS , 后面3个值均无应该会报错,也有可能该函数并未执行 ), 未见调用 # 更新roidb[i]'info_boxes'字段、增加'data'和'parameters'字段 def get

Tensorflow版Faster RCNN源码解析(TFFRCNN) (10) roi_data_layer/roidb.py

烈酒焚心 提交于 2019-11-26 15:51:40
本blog为github上 CharlesShang/TFFRCNN 版源码解析系列代码笔记 --------------- 个人学习笔记 --------------- ---------------- 本文作者吴疆 -------------- ------ 点击此处链接至博客园原文 ------ """Transform a roidb into a trainable roidb by adding a bunch of metadata 元数据.""" 1.prepare_roidb(imdb) roidb = imdb.roidb ,增加 roidb[i]中'image'(记录图像路径)、'width'(记录图像宽)、'height'(记录图像高)、'max_classes'(记录图像中各roi与哪类gt IOU最大)、'max_overlaps'(记录各roi与gt最大的IOU值)字段赋值得到( 'imdb' )数据集所有图像的roidb, 未见调用 # 增加roidb[i]中'image'(记录图像路径)、'width'(记录图像宽)、'height'(记录图像高)、 # 'max_classes'(记录该图像中各roi与哪类gt IOU最大)、'max_overlaps'(记录各roi与gt最大的IOU值)字段赋值得到数据集所有图像的roidb def

Faster RCNN Tensorflow在测试得到result.txt文件

眉间皱痕 提交于 2019-11-26 13:46:49
需要准备三个路径: 1、一个是进行测试时所使用的那些图片,找到其路径 2、result.txt所在的路径 3、生成图像的存放路径 1 #!/usr/bin/env python 2 3 4 from __future__ import absolute_import 5 from __future__ import division 6 from __future__ import print_function 7 8 import _init_paths 9 from model.config import cfg 10 from model.test import im_detect 11 from model.nms_wrapper import nms 12 13 from utils.timer import Timer 14 import tensorflow as tf 15 import matplotlib.pyplot as plt 16 from PIL import Image 17 import numpy as np 18 import os, cv2 19 import argparse 20 21 22 from nets.vgg16 import vgg16 23 from nets.resnet_v1 import resnetv1 24 25

Faster Rcnn 代码解读之 roidb.py

不问归期 提交于 2019-11-26 13:18:38
# -------------------------------------------------------- # Fast R-CNN # Copyright (c) 2015 Microsoft # Licensed under The MIT License [see LICENSE for details] # Written by Ross Girshick # -------------------------------------------------------- """Transform a roidb into a trainable roidb by adding a bunch of metadata.""" from __future__ import absolute_import from __future__ import division from __future__ import print_function import numpy as np from model.config import cfg from model.bbox_transform import bbox_transform from utils.cython_bbox import bbox_overlaps import PIL '''

机器学习、计算机视觉面经整理(持续完善整理中……)

强颜欢笑 提交于 2019-11-26 12:58:40
算法岗计算机视觉方向 求职经验总结 进入11月份,楼主找工作也基本进入尾声了,从7月份开始关注牛客网,在求职的过程中学到了不少,感谢牛客提供这样一个平台,让自己的求职历程不再孤单。 先说一下楼主教育背景,本科西部末流985,研究生调剂到帝都某文科学校.专业都是CS专业,求职方向都是计算机视觉算法。有某外企以及二线互联网实习经历,本科虽然CS出身,但实际动手能力并不强。研究生的研究方向并不是计算机视觉方向。实习的时候开始接触计算机视觉,自己比较感兴趣,开始转CV方向。回想这几个月的求职经历,其中的辛苦只有自己知道。最终拿到了 百度SP ,京东SSP,美团无人驾驶SP,顺丰科技SP,拼多多SP,以及虹软SP,思科,中电29等offer。 想把我学习与求职路上的一些心得告诉学弟学妹们。 1. 一定要有一门自己比较熟悉的语言。 我由于使用C++ 比较多,所以简历上只写了C++。C++的特性要了解,C++11要了解一些,还有STL。面试中常遇到的一些问题,手写代码实现一个string类,手写代码实现智能指针类,以及STL中的容器的实现机制,多态和继承,构造函数, 析构函数等。推荐看一下 网易云课堂翁恺老师 的C++ 的视频以及经典的几本书。 2.一定要刷题 楼主主要刷了 剑指offer 以及leetcode上的easy,middle的题目。如果编程能力不是很强,推荐可以分类型进行刷题

网易面试记录

对着背影说爱祢 提交于 2019-11-25 19:01:21
网易面试的效率很高,一到三面一晚上就搞完了,每一位面试官都十分有礼貌,这里给网易点个赞。 附:应聘的算法岗 一面: 1、自我介绍 2、聊简历中的项目 3、说说你对双向LSTM的理解,它和单项LSTM有什么区别 4、做了一算法题:100个球两个人每次最多取五个最少取一个,谁能拿到最后一个就赢,求第一个取的人的必胜方法. 二面: 1、详细说一说dropout原理 2、常用的损失函数有哪些,缓解过拟合有哪些方式 3、你怎么理解L1,L2正则,它们通过什么机制起作用,在平面上大致形状是什么样的? 4、cnn中假如输入是100x100x3,卷积核是3x3,输出是100个channel,问:网络的参数数量 5、开放性问题:给你一个不知道大小的image,如何裁剪出原图80%大小的图 6、算法题:堆排 三面: 1、Yolov1,Yolov2,Yolov3详细说一下每个的区别和进步 2、rcnn,fast-rcnn,faster-rcnn之间的区别和联系 3、yolo哪一代开始用anchor了,怎么产生的,faster rcnn呢 4、说一说你论文中的LCA算法,工作原理是什么样的? 5、手写一下k-means,轮廓系数也写一下 6、算法题:链表找环. 整体感觉都是考察的基础,都不难,但对自己答的还是不满意,三面之后等消息吧,自己能做的就是好好总结复习。 这里祝网易越来越好。 来源: https: