计算机视觉

【走进OpenCV】霍夫变换检测直线和圆

大城市里の小女人 提交于 2021-02-06 01:12:34
小白导读 学习计算机视觉最重要的能力应该就是编程了,为了帮助小伙伴尽快入门计算机视觉,小白准备了【走进OpenCV】系列,主要帮助小伙伴了解如何调用OpenCV库,涉及到的知识点会做简单讲解。 本文主要借鉴Madcola发布在简书上的文章,转载请联系原作者,禁止二次转载。 我们如何在图像中快速识别出其中的圆和直线?一个非常有效的方法就是霍夫变换,它是图像中识别各种几何形状的基本算法之一。 霍夫线变换 霍夫线变换是一种在图像中寻找直线的方法。OpenCV中支持三种霍夫线变换,分别是标准霍夫线变换、多尺度霍夫线变换、累计概率霍夫线变换。 在OpenCV中可以调用函数HoughLines来调用标准霍夫线变换和多尺度霍夫线变换。HoughLinesP函数用于调用累积概率霍夫线变换。 我们都知道,二维坐标轴上表示一条直线的方程式y = a*x + b,我们想求出一条直线就得想方设法求出其中的a和b的值。如果用极坐标来表示就是 theta就是直线与水平线所成的角度,而rho就是圆的半径(也可以理解为原点到直线的距离),同样地,这两个参数也是表征一条直线的重要参数,确定他们俩了,也就确定一条直线了。正如下图所示。 在OpenCV里,我们只需调用HoughLines就是可以得到表征一条直线的这两个参数值! HoughLines用法 # include <iostream> # include

“新内容 新交互” 阿里云全球视频云创新挑战赛正式开启!

随声附和 提交于 2021-02-05 11:31:12
本届全球视频云创新挑战赛是由阿里云联手英特尔主办,与优酷战略技术合作,面向企业以及个人开发者的音视频领域的数据算法及创新应用类挑战。 本届大赛包括两个赛道:“算法挑战赛” 和 “创新应用挑战赛”,参赛选手可以自由报名参加任一赛道。选手可以在视频分割挑战以及视频创新应用领域中,发挥自己的创造力,探索视频云技术在互联网、零售、文娱、安防、文化、教育、金融、交通、公共安全、日常生活、公益等行业领域的应用。 赛程安排 • 报名与实名认证(即日起 —2021 年 4 月 14 日,UTC+8) • 初赛(2021 年 2 月 1 日 - 4 月 16 日,UTC+8) • 复赛(2021 年 4 月 21 日 - 2021 年 6 月 18 日,UTC+8) • 总决赛(2021 年 6 月底,UTC+8) 赛道介绍 算法挑战赛道 算法挑战赛道聚焦视频人像分割领域。视频物体分割将传统图像分割问题延伸到视频领域,可服务于视频理解处理和编辑等任务,近年来成为计算机视觉领域备受关注的研究问题,该问题的目标是在视频帧中分割目标物体的区域,需精确到像素级别。作为视频中经典而重要的内容,人像分割任务将作为本竞赛的分割目标。 创新应用赛道 创新应用赛道要求应用指定的相关技术,解决视频领域和相关行业的的痛点问题,实现应用场景的创新,以技术可行性 / 前瞻性 / 落地价值作为重要评审考察点。 奖项设置 PS

用神经网络给照片补光,谷歌这项研究却实现了「鬼片」效果!(胆小勿入)

旧时模样 提交于 2021-02-05 06:05:44
打光是图像处理过程中的重要步骤,打光的好坏可能会影响整体效果的展示。打光方法也各有不同,MIT、谷歌等的一项新研究另辟蹊径,通过神经光传输方法进行图像的二次打光和视图合成,实现了相当不错的效果。 机器之心报道,编辑:魔王、杜伟、小舟。 图像合成早已不是新鲜话题,但是「打光」可是所有照片的难题。对于人类摄影师而言,打光就是件挺复杂的事,那么合成图像中的光线问题又该如何解决呢? 最近,来自 MIT、谷歌和加州大学圣地亚哥分校的研究人员进行了一项研究,试图 通过神经光传输(Neural Light Transport,NLT)对图像进行二次打光(relighting)和视图合成(view synthesis) 。 那么,这项研究提出的 NLT 方法效果如何呢?研究者在多个场景下进行了测试,包括 Directional Relighting、基于不同图像背景的打光、根据摄像头路径不同进行视图合成后的打光效果等等。 效果看起来不错,就是有点像鬼片……(瑟瑟发抖 具体而言,在 Directional Relighting 场景下,NLT 实现了如下效果: 在基于图像的 Relighting 场景下,人物的打光效果随着背景图像的变换而不断调整: 那么在涉及视图合成时,效果如何呢? 同时进行二次打光和视图合成呢? 想查看更多效果?请戳以下视频: https://v.qq.com/x/page

“新内容 新交互” 阿里云全球视频云创新挑战赛正式开启!

本小妞迷上赌 提交于 2021-02-04 13:23:15
本届全球视频云创新挑战赛是由阿里云联手英特尔主办,与优酷战略技术合作,面向企业以及个人开发者的音视频领域的数据算法及创新应用类挑战。 本届大赛包括两个赛道:“算法挑战赛” 和 “创新应用挑战赛”,参赛选手可以自由报名参加任一赛道。选手可以在视频分割挑战以及视频创新应用领域中,发挥自己的创造力,探索视频云技术在互联网、零售、文娱、安防、文化、教育、金融、交通、公共安全、日常生活、公益等行业领域的应用。 赛程安排 报名与实名认证(即日起 —2021 年 4 月 14 日,UTC+8) 初赛(2021 年 2 月 1 日 - 4 月 16 日,UTC+8) 复赛(2021 年 4 月 21 日 - 2021 年 6 月 18 日,UTC+8) 总决赛(2021 年 6 月底,UTC+8) 赛道介绍 算法挑战赛道 算法挑战赛道聚焦视频人像分割领域。视频物体分割将传统图像分割问题延伸到视频领域,可服务于视频理解处理和编辑等任务,近年来成为计算机视觉领域备受关注的研究问题,该问题的目标是在视频帧中分割目标物体的区域,需精确到像素级别。作为视频中经典而重要的内容,人像分割任务将作为本竞赛的分割目标。 创新应用赛道 创新应用赛道要求应用指定的相关技术,解决视频领域和相关行业的的痛点问题,实现应用场景的创新,以技术可行性 / 前瞻性 / 落地价值作为重要评审考察点。 奖项设置 PS:现金大奖哦!

Papers With Code新增数据集检索功能:3000+经典数据集,具备多种过滤功能

|▌冷眼眸甩不掉的悲伤 提交于 2021-02-04 08:28:16
机器之心报道 作者:陈萍 转载自: 机器之心 原文链接: Papers With Code新增数据集检索功能:3000+经典数据集,具备多种过滤功能 ​ mp.weixin.qq.com Papers with Code 现在已经集成了 3044 个机器学习数据集,点点鼠标就能检索需要的数据集。 在机器学习中,数据集占据了重要的一部分。研究人员除了需要开发先进的算法外,其实数据集的建立才是最基础也是最重要的部分。在过往的研究中,机器学习从业者也建立了许多可用的数据集。 在哪里可以找到比较好的数据集呢? 近日,查找论文对应开源代码的神器 Papers with Code 官网发布,Datasets 已经实现了 3044 个机器学习数据集的汇总,并且按照不同的类型进行归类,还具有过滤功能,值得一看。 我们现在正在索引 3000 + 来自机器学习的数据集。使用者可以按照任务分类和模式进行数据集查找,还可以按照时间比较数据集的使用情况、浏览基准等要素进行查找。 网站地址: https://www. paperswithcode.com/data sets 覆盖范围众多的数据集 在这 3044 个机器学习数据集里,不乏我们常用的经典数据集,例如,ImageNet、COCO、CIFAR-10、MNIST 等。 快速检索 如果你想搜索指定的数据集,该网站也具备检索功能,例如从事计算机视觉的研究者

全球TOP30院校导师亲授:深度学习在多场景中的应用

人走茶凉 提交于 2021-02-04 04:25:44
了解 完整课程详情 可扫描下方二维码添加顾问老师,备注 【 P anda】 即可咨询 更有盐趣内部学员专属人工智能、计算机视觉讲座回放及参考书资料包现免费领取~ 盐趣计算机方向导师团队由 卡耐基梅隆大学CS教授V.G.与南加州大学CS教授V.A. 领衔,包括近300位博士、博后研究员、教授、科学家等,全部来自英国牛津大学、剑桥大学,美国卡耐基梅隆大学、南加州大学、斯坦福大学、耶鲁大学等世界顶尖院校,囊括 计算机科学、计算机工程、数据科学、机器学习、人工智能、计算机视觉、机器人 等多个热门专业和细分方向,实力雄厚。 部分盐趣计算机方向学员论文录用函 顶会、EI、SCOPUS等(滑动查看更多) 此外,我们还为读者送出了专属福利: 免费1对1科研规划咨询 ,有学术论文、背景提升、升学规划方面的疑问,都可以找他们解决。无论你未来的升学计划如何,希望你都能好好把握寒假这个 弯道超车 的机会! 长按识别海报中的二维码 添加盐趣学术顾问微信预约 添加微信时请备注: P anda 了解更多课程请咨询学术顾问 本文分享自微信公众号 - GiantPandaCV(BBuf233)。 如有侵权,请联系 support@oschina.cn 删除。 本文参与“ OSC源创计划 ”,欢迎正在阅读的你也加入,一起分享。 来源: oschina 链接: https://my.oschina.net/u

给女朋友买了只口红,结果她跟我说分手?掌握了机器学习再买买买吧!

↘锁芯ラ 提交于 2021-02-04 02:39:40
过完年,压岁钱到位,迟来的年终奖到账,钱包鼓起来但新的节日也不断跟上,情人节、元宵节、妇女节…… 说到底,还不是要买买买? 淘宝上的店铺又多又杂乱,一旦买错了, 面临的就是“女 ” 朋友的“果真直男审美 ” 的diss,或者人财两空的局面 接下去,来看看用机器学习技术如何甄别优质店铺,让你买到就是赚到! 分三步走: 第一步:找到阿里给出的店铺评价历史信息,分为训练集数据和测试集数据; 第二步:利用训练集数据构建机器学习模型; 第三步:使用测试集数据进行准确率判断并优化。 如此便可以建立一个相对科学的靠谱店铺预测模型。 首先,从阿里云天池开一份包含2000家店铺的评分,等级,评论等信息和数年交易记录的数据: 通过这份数据, 我们可以构建一套模型,根据店铺的访问、购买信息等数据,来评测该店铺是否为优质店铺。 一部分数据将用来作为训练集,另一部分数据会用来测试已经训练好模型的精确度。但训练的时候并不是精确度越高越好,过拟合和欠拟合都不是好事情。 欠拟合指模型没有很好地捕捉到数据特征,不能够很好地拟合数据: 过拟合通俗一点地说就是模型把数据学习的太彻底,以至于把噪声数据的特征也学习到了,这样就会导致在后期测试的时候不能够很好地识别数据,即不能正确的分类,模型泛化能力太差: 随后,完成了清理整合等预处理工作,得到了一份适合建模使用的样本数据: *完整代码可以在文末获取。考虑这份数据比较粗糙

[计算机视觉论文速递] 2018-04-28

泪湿孤枕 提交于 2021-02-02 14:47:20
通知:这篇文章有6篇论文速递信息,涉及视觉跟踪、Zero-shot Learning、GAN和人员计数等方向(含2篇CVPR论文) [1]《View Extrapolation of Human Body from a Single Image》 CVPR 2018 Abstract:我们研究如何从单个图像合成人体的新视图。尽管最近基于深度学习的方法对于刚性物体很适用,但它们通常在大型关节的物体(如人体)上失败。现有方法的核心步骤是将可观察的视图与CNN的新视图相匹配;然而,人体丰富的发音模式使得CNN很难记忆和插入数据。为了解决这个问题,我们提出了一种新的基于深度学习的pipeline,明确地估计和利用underlying人体的几何形状。我们的pipeline是一个形状估计网络和一个图像生成网络的组合,并且在接口处应用透视变换来生成像素值传输的正向流。我们的设计能够将数据变化的空间分解出来,并使每一步的学习变得更容易。经验上,我们表明姿态变化对象的性能可以大大提高。我们的方法也可应用于3D传感器捕获的实际数据,并且我们的方法生成的流可用于生成高分辨率的高质量结果。 arXiv: https://arxiv.org/abs/1804.04213 视觉跟踪 [2]《VITAL: Visual Tracking via Adversarial Learning》 CVPR 2018

[计算机视觉论文速递] 2018-04-19

半世苍凉 提交于 2021-02-02 14:46:58
通知:这篇文章有8篇论文速递信息,涉及目标识别、SLAM、3D Model、密集点集配准、立体匹配等方向(含6篇CVPR论文) 目标识别 [1]《Hierarchical Novelty Detection for Visual Object Recognition》 CVPR 2018 Abstract:深度神经网络在具有预定义类别的大规模视觉对象识别任务中取得了令人瞩目的成功。然而,在训练期间识别新类(即未被看见的对象)仍然具有挑战性。在文献中已经讨论了检测这种新类的问题,但是之前大多数工作都是提供简单的二元或回归决策,例如,输出将是“已知的”,“新颖的”或相应的置信区间。在本文中,我们研究更多的基于分层分类框架的信息新颖性检测方案。对于一个新类的对象,我们的目标是在已知类的分层分类中找到它最接近的超类。为此,我们提出了两种不同的方法,称为自顶向下和扁平化方法,以及它们的组合。我们方法的基本组成部分是置信度校正分类器,数据重新标记以及在分层分类法下对新类进行建模的“一次退出”策略。此外,我们的方法可以生成分层嵌入,结合其他常用的语义嵌入,可以提高广义零点学习性能。 arXiv: https://arxiv.org/abs/1804.00722 SLAM [2]《CodeSLAM - Learning a Compact, Optimisable Representation

计算机视觉论文速览

泪湿孤枕 提交于 2021-02-02 04:50:16
CV_0404 1.【数据集】The Unmanned Aerial Vehicle Benchmark:Object Detection and Tracking 本文建立了一个用于无人机识别和跟踪任务的复杂场景数据集,包括80000帧从10h视频中抽取出的标记图像和14中环境特征,用于 目标检测和追踪 任务的训练。 >>UAVDT数据集 现有的无人机数据集: UAVDT数据集: 2.【目标检测】Hierarchical Novelty Detection for Visual Object Recognition 本文利用层级分类的框架实现了对于新物体的分类和检测任务。将新物体归入最邻近超类并进行进一步分类,提出了自顶向下和平铺的方法并结合生成新的分类器。 >>论文 架构示意图: 此方法的数值结果: Ref:论文来自arxiv 来源: oschina 链接: https://my.oschina.net/u/4281503/blog/4017670