Spatial

Convolutions in TensorFlow

有些话、适合烂在心里 提交于 2020-10-28 14:34:51
Convolutions in TensorFlow Convolutions without training You might already be familiar with the term "convolution" from a mathematical or physical context. In the mathematical context, "convolution" is defined, by Oxford dictionary, as followed: a function derived from two given functions by integration that expresses how the shape of one is modified by the other. Gif source: Wikipedia And that's pretty much what convolution means in the machine learning context. Convolution is how the original input is modified by the kernel (or filter/feature map). To better understand convolutions, Chris

Learning Conditioned Graph Structures for Interpretable Visual Question Answering

烈酒焚心 提交于 2020-10-28 11:54:24
Learning Conditioned Graph Structures for Interpretable Visual Question Answering 2019-05-29 00:29:43 Paper : http://papers.nips.cc/paper/8054-learning-conditioned-graph-structures-for-interpretable-visual-question-answering.pdf Code : https://github.com/aimbrain/vqa-project 1. Background and Motivation : 最近的计算机视觉工作开始探索图像的高层表达(higher level representation of images),特别是利用 object detector 以及 graph-based structures 以进行更好的语义和空间图像理解。将图像表达为 graphs,可以显示的进行模型交互,通过 graph iterms(objects in the image) 无缝进行信息的迁移。这种基于 graph 的技术已经在最近的 VQA 任务上应用上。这种方法的一个缺点是:the input graph structures are heavily engineered,

Mysql索引(简单了解)

拈花ヽ惹草 提交于 2020-10-28 11:43:42
Mysql的存储引擎,可以针对不同的表使用不同的存储引擎   MyISAM:插入,查血速度快,但是不支持事物,所以适用于数据仓库,Web等   InnoDB:支持事物,所以适合于事物型数据库   Memory:是将数据存到内存中   Archive:事物不安全,所以可以用来保存日志什么的 每个引擎细致的还有许多特点,有空可以看看 ----------------------------------------------------------------------------------   索引   Mysql存储引擎有两种 B树和Hash   索引的优点:可以针对指定的一个列或者多个列建立索引,加快查询速度         可以减少分组或者排序子句的执行时间   索引的缺点:多占内存         对表进行修改增加删除的时候,相应的索引也需要更改   索引的分类:单列索引和组合索引           单列索引指的就是一个索引只有一个列,但是一个表可以有多个单列索引           组合索引指的就是在表的多个字段上创建的索引   全文索引:支持值的全部查找,允许重复和null   创建索引:在建立表的时候创建   简单的对某个列创建索引 查看索引是否创建成功   select_type指的是select的类型 比如简单查询,子查询,联合查询 table 查询的表名

最有影响力的计算机视觉会议及期刊论文

此生再无相见时 提交于 2020-10-28 05:54:48
1 最有影响力的30篇计算机视觉会议论文 选取论文的原则: (1)会议论文,主要来源于以下会议:CVPR, ICCV, ECCV, BMVC, FG, ICIP, ICPR, WACV, ICASSP, MM, IJCAI, UAI, AAAI…(其实后面的几个会议都是打酱油的,AI类的期刊也木有高引CV文章,事实也是如此,没有收录ICML和NIPS等,见谅) (2)发表在2000年以后,数据来源于微软学术搜索(http://academic.research.microsoft.com/),2012年12月初的检索结果 (3)检索次数大于200,PER>50,微软学术搜索的被检索次数未必精确,但能反应大概趋势,PER指意味着每年检索量,自发表次年算到2012年,PER=Cited/(2012-YEAR) 榜单Top 30如下,欢迎拾遗补缺: [1] Rapid Object Detection using a Boosted Cascade of Simple Features (Citations: 3296, PER=299.64) Paul A. Viola, Michael J. Jones @CVPR , vol. 1, pp. 511-518, 2001 [2] Histograms of Oriented Gradients for Human Detection

ICRA2019 | 用于移动设备的双目立体匹配

五迷三道 提交于 2020-10-22 08:46:24
点击 上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 作者: 红薯好吃 https://zhuanlan.zhihu.com/p/86481492 本文仅做学术分享,如有侵权,请联系删除。 2019机器人顶会ICRA一篇关于可以满足移动设备的双目立体模型 代码地址: https://github.com/mileyan/AnyNet 论文题目 《Anytime Stereo Image Depth Estimation on Mobile Devices》 论文摘要: 许多用于机器人领域的深度估计方法都对实时性有很大的需求。目前sota模型面临在精度和实时性做出平衡的问题,加快推理速度往往会导致精度大幅度下降。针对这个问题,作者提出了一种高速推理模型。该模型能够处理1242x375分辨率的双目图片,在NVIDIA Jetson TX2上达到10-35FPS。在减少两个数量级参数情况下,仅仅比SOTA精度略微下降。 方法概述 图1 图1所示,是作者提出的AnyNet预测的时间线示意图,视差是随着时间逐步优化的。这个算法可以随时返回当前最优的视差。initial estimates即使精度不高,但是足以触发避障操作,之后的更优的深度图可以为更高级的路径规划提供线索。 AnyNet整体网络示意图如图2所示: 图2 AnyNet利用U-Net架构提取多分辨率级别下的特征

MyDLNote-Event : CVPR 2020 Event Enhanced High-Quality Image Recovery基于事件相机的高质量图像修复

守給你的承諾、 提交于 2020-10-14 20:17:31
Event Enhanced High-Quality Image Recovery Dataset, code, and more results are available at: https://github.com/Shi nyWang33/eSL-Net. (目前好像还不能用) [paper] : https://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123580154.pdf My Note: 这篇文章的重大贡献是: 1. 同时处理事件相机的噪声、模糊和超分辨的强度图像重建; 2. 整个网络是可解释的,网络结构就是对稀疏编码解的结构; 3. 构造了一个数据集,包括 HR 的清晰强度图像;LR 的清晰强度图像;LR 的含噪声和运动模糊图像;事件相机序列。 本文是一个监督学习模型,从给定的 HR 清晰图像通过人工方式,得到一系列待处理的数据。看似不太合理,人工合成图像真的能适用于真实场景吗?因此,本文的结论特别指出:可以。 额,如果可以有改进,有两点:1,那当然不要用人工合成数据;2, 如果不用人工合成,那 pair 的图像好像不好获得,因此,要考虑无监督方法。 Abstract With extremely high temporal resolution, event cameras have a large

不限机型,手机端实时玩转3D、混合现实,快手Y-tech有黑科技

一世执手 提交于 2020-10-13 06:44:57
  机器之心报道    机器之心编辑部   深度是实现 3D 场景理解的重要信息,快手 Y-tech 利用自研的单目深度估计技术获得了高质量的深度信息,并将模型部署到移动端,结合 Y-tech 已有的多项技术研发了 3DPhoto、混合现实等多种新玩法。这些黑科技玩法不限机型,可让用户在手机上无门槛的实时体验,给用户带来全新的视觉体验和交互方式的同时,可帮助用户更好的进行创作。      这项研究主要探究了如何更好的利用三维空间的结构性信息提升单目深度估计精度,此外还针对复杂场景构建了一个新的深度数据集 HC Depth,包含六种挑战性场景,有针对性地提升模型的精度和泛化性。该论文已被 ECCV 2020 收录,论文代码和模型即将在 GitHub 上开源,作者也将在 8 月 23-28 日的 ECCV 大会线上展示他们的工作。      论文链接:https://arxiv.org/abs/2007.11256   代码链接:https://github.com/ansj11/SANet    单目深度估计的挑战   从 2D 图像恢复 3D 信息是计算机视觉的一个基础性问题,可以应用在视觉定位、场景理解和增强现实等领域。在无法通过深度传感器或者多视角获得有效的深度测量时,单目深度估计算法尤为重要。传统方法通常使用先验信息恢复图像的深度信息,例如纹理线索,物体尺寸和位置

MySQL索引分类

杀马特。学长 韩版系。学妹 提交于 2020-10-09 00:30:45
1、普通索引 即不应用任何限制条件的索引,该索引可以在任何数据类型中创建。字段本身的约束条件可以判断其值是否为空或唯一。 2、唯一索引: 不允许其中任何两行具有相同索引值的索引。 3、主键索引: 在数据库关系图中为表定义主键将自动创建主键索引,主键索引是唯一索引的特定类型。该索引要求主键中的每个值都唯一。当在查询中使用主键索引时,它还允许对数据的快速访问。 4、聚集索引: 表中行的物理顺序与键值的逻辑(索引)顺序相同。一个表只能包含一个聚集索引。聚集索引通常提供更快的数据访问速度。 5、全文索引 使用FULLTEXT参数可以设置全文索引。全文索引只能创建在CHAR、VARCHAR、TEXT类型的字段上。查询数据量较大的字符串类型字段时,使用全文索引可以提高查询速度。注意:全文索引在默认情况下是对大小写字母不敏感的,可以通过使用二进制对索引的列进行排序以执行大小写敏感的全文索引。MySQL中只有MyISAM存储引擎支持全文索引 6、单列索引 顾名思义,单列索引值对应一个字段的索引。可以包括上述的三种索引方式。应用该索引的条件只需要保证该索引值对应一个字段即可。 7、多列索引 多列索引是在表的多个字段上创建一个索引。该索引只想创建时对应的多个字段,可以通过这几个字段进行查询。要想应用该索引,用户必须使用这些字段中的第一个字段。 8、空间索引 使用SPATIAL参数可以设置控件索引