像素

opencv —— threshold、adaptiveThreshold 固定阈值、自适应阈值

自古美人都是妖i 提交于 2020-02-16 21:11:37
阈值化 在对图像进行处理操作的过程中,我们常常需要对图像中的像素做出取舍与决策,直接剔除一些低于或高于一定值的像素。 阈值分割可以视为最简单的图像分割方法。比如基于图像中物体与背景之间的灰度差异,可以利用阈值分割出我们需要的物体。这种分割是像素级的分割,为了从一幅图像中提取我们需要的部分,应该用图像中的每个像素点的灰度值与选择的阈值进行比较,并作出取舍判断。 注意,阈值的选取依赖于具体问题,物体在不同的图片中可能会有不同的灰度值。一旦找到了需要分割的物体的像素点,可以对这些像素点设定一些特定的值来表示。例如可以将物体的像素点的灰度值设定为”0“(黑色),其他像素点的灰度值设为”255“(白色)。 OpenCV 中 threshold() 函数 (固定阈值操作)和 adaptiveThreshold() 函数(自适应阈值操作)可以满足这样的需求。它们的基本思想是:给定一个数组和一个阈值,根据数组中的每个元素的值是高于还是低于阈值而进行一些操作。 固定阈值操作:threshold 函数 threshold() 函数是对单通道数组应用固定阈值操作。该函数的典型应用是对灰度图像进行阈值操作得到二值图像(compare 函数也可以达到此目的),或者去除噪声,过滤掉像素值很小或很大的图像点。 double threshold(InputArray src, OutputArray dst,

论文阅读——Optimizing the Convolution Operation to accelerate DNN on FPGA

跟風遠走 提交于 2020-02-15 13:03:23
论文阅读之FPGA硬件加速 Optimizing the Convolution Operation to Accelerate Deep Neural Networks on FPGA 时间:2018 期刊:IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS Section I 本文的主要贡献有: (1)深入分析卷积运算中的循环计算,通过减少循环层数来加速卷积计算 (2)通过浮点到定点的转换来加速CNN的计算,主要减少存取数据和访问存储器的时间 (3)设计了一个数据路由来处理不同类型的卷积运算,如步长、0填充等,尤其对于irregular CNNs,设计了data router并进行了硬件实现 (4)本文的加速策略在NiN,VGG-16,ResNet等网络架构上进行了验证 Section II CNN中的循环 Loop Unrolling 循环展开 剖析CNN中的四层循环 Loop Unrolling循环展开 Loop 1:每一个卷积核内的乘加运算MAC 一个filter中不同位置的数据做MAC Loop 2:一个filter在所有输入特征图同一像素点的不同通道层(feature map的个数)上的循环 做inner product后相加 Loop 3:一个filter在一张feature

移动端适配之路的一步步了解

China☆狼群 提交于 2020-02-13 21:33:08
》开始入手第一部分知识点 关于viewport(视口)的了解 视口就是浏览器中用于显示网页的区域,PC端,视口的宽度等于浏览器窗口的宽度。而在移动端,视口又分为布局视口(layout viewport)、视觉视口(visual viewport)和理想视口(ideal viewport)。 那什么是布局视口( layout viewport)? 视口与浏览器屏幕不相关联,CSS布局会根据他来计算,并被他约束,为了容纳为桌面浏览器设计的网站,移动设备默认的布局视口宽度远大于屏幕的宽度,其大小与设备有关。 通过document.documentElement.clientWidth/Height可得到布局视口的尺寸 什么是视觉视口( visual viewport) ? 用户看到的网站区域,即用户看到网页区域内CSS像素的数量(注意, 是网站区域,不要和屏幕区域混淆了) 屏幕通过手势放大时,用户可看到的网站区域相对减小,此时视觉视口也在减小 通过window.innerWidth/Height可得到视觉视口的尺寸 什么是理想视口( ideal viewport)? 为浏览器定义的可完美适配移动端的视口,可认为是设备视口宽度 只有当为页面添加meta视口标签时,理想视口才会生效,如下: //这一行代码告诉浏览器,布局视口的宽度应该与理想视口的宽度一致 <meta name="device

19ICCV之REeID:RGB-Infrared Cross-Modality Person Re-Identification via Joint Pixel and Feature Alignm

可紊 提交于 2020-02-13 00:53:13
RGB-Infrared Cross-Modality Person Re-Identification via Joint Pixel and Feature Alignment 当前的问题及概述 : 传统的方法主要是通过特征表示学习来弥补跨模态和特征对齐之间的差异,其基本思想是通过特征表示学习来匹配真实的RGB和IR图像。由于两种模式之间存在较大的交叉模态差异,因此很难在共享的特征空间中准确地匹配RGB和IR图像。 同时, Cross-Modality Person Re-Identification with Generative Adversarial Training 提出的CMGAN与本文同属于用GAN网络解决跨模态问题,但是CMGAN的rank1,mAP和ICCS(其中更大的ICCS值意味着更高的相似性): 结果表明,该算法在交叉模态设置下性能较差,不能很好地克服交叉模态变化。 本文提出了一种用于RGB-IR reid任务的端到端对齐生成对抗网络(AlignGAN)。 本文提出的网络有以下几个特点: 1. 可以联合利用像素对齐和特征对齐。这是首次为RGB-IR RE-ID问题联合建立两种校准策略的模型。 2. 该模型由像素生成器、特征发生器和联合鉴别器组成,这样,不仅能够缓解跨模态和模态内的变化,而且能够学习到身份一致的特征。 3. 在SYSU-MM01数据集中

Pillow之Image模块(一)

天大地大妈咪最大 提交于 2020-02-12 04:06:11
Image类属性 Image类中的属性表示了一张图像的基本信息,现将其主要属性总结如下: format        图像的文件格式 size         图像的大小(单位为像素),形如(宽度,高度)的2元组 width         图像宽度(单位为像素) height        图像高度(单位为像素) mode         图像的模式,常见模式如下: 图像模式 属性 1 1位像素,每个像素用8个bit表示,黑白二值图,0-黑,255-白 L 灰度图,每像素用8位二进制代码表示 P 8位彩色模式,每个像素用8位二进制代码表示, 其对应的色彩是按照调色板查询出来的 RGB 3*8位像素,每像素用3个二进制字节代码表示,表示真彩色图像 RGBA 4*8位像素,带透明蒙版的真彩色,每像素用4个字节二进制代码表示,其中的A为alpha透明度 CMYK 印刷模式,每个像素用4个字节二进制代码表示。C=青色;M= 品红色;Y= 黄色;K=黑色 LAB Lab颜色空间,每像素用3个字节二进制代码表示 YCbCr 3*8位像素,彩色视频格式 HSV 3*8位像素,H为色相,S为饱和度,V为颜色空间 I 整数形式表示像素,每像素用4个字节二进制代码表示 F 浮点数形式表示像素,每像素用4个字节二进制代码表示 filename       图像的文件名或者路径 bits        

基于matlab的图像腐蚀原理与去噪应用

一曲冷凌霜 提交于 2020-02-11 18:35:05
写本文的目的是记录自己做过的一些东西,深化理解,理清思路,便于回忆。本人处于学习阶段,欢迎指出不对的地方。 数学形态学是数字图像处理中一种很独特的方法,它基于像素与其周遭像素的位置灰度关系来完成某些功能。膨胀和腐蚀是最常见的处理方法,由此衍生出来的还有开运算、闭运算、梯度运算、顶帽(Top Hat)、黑帽(Black Hat)等,此次利用膨胀和腐蚀来处理加入泊松噪声的图像,使图像在尽可能减小损失的情况下完成噪声的滤除。 简单来说,图像腐蚀就是滑动算子取区域最小值,在算子为1的区域内选取最小值作为该像素的输出值,然后用相同的操作遍历整个图像。腐蚀和膨胀是对高像素值(高亮)部分而言的,不是低像素值的黑色部分。 开始试验 1.预处理和加入噪声 首先引入要处理的图像 将图像转换为灰度图像(彩色图像问题要将图像分为三层去处理,三层图像后期合并时也许还会出现一些颜色上的误差,需要进一步讨论,此处暂且不顾) 加入泊松噪声。泊松噪声从视觉效果来看类似于高斯噪声,但服从泊松分布。 2.创建形态学算子 使用腐蚀来去除图像噪声。腐蚀属于图像形态学方法的一种,进行腐蚀前首先要确定腐蚀所用的算子,此处创建两个算子方便对比,一个是三阶单位矩阵,另一个是三阶的副对角线为1,其余元素为0的矩阵,二者形态上对称。将单位矩阵称作-45度模板,另一个称为45度模板。 3.运算 使用imeroad(

数码相机专业术语解释

时光怂恿深爱的人放手 提交于 2020-02-11 10:54:39
数码相机专业术语解释 在选购数码相机的时候,相信很多人会对数码相机各种纷繁复杂的参数搞得头昏脑胀。由于数码影像技术发展迅速,即使是常常关注这一行的人也常会对一些新出现的技术感到迷惑不解。现在就把目前市面上主要的技术指标的定义讲一下,希望对消费者们购买数码相机有帮助。      一:基础知识 像素、感光元件、尺寸、有效像素、分辨率      通常消费者最为关注的是相机的像素,像素也的确是数码相机最重要的一项硬指标,也就是说,像素高了不一定是好相机,但是像素太低(以目前的市场主流,300万以下就算比较低了)怎么都不能算是好相机。      像素:      要说像素首先得讲一下数码相机的感光原理,要拍照片首先要将光信号转换成电信号,这靠的就是感光元件(Sensor),在数码相机的镜头后面都有一块芯片,上面密密麻麻地挤满了这些感光元件,每个感光元件只能将很小的一点转换成图像,这些小的图像加起来就成了我们可以看见的图像了。讲到这里大家有点明白了吧,不错,像素其实就是这些感光元件,我们平时说的多少万像素就是这些感光元件的个数了。所以一般来讲像素越大,成像也就越清晰细腻,当然这其中还要受许多因素限制,下面会慢慢提到的。      接下来要讲的就是为什么高像素不一定是好相机的一个原因:尺寸      尺寸:      尺寸就是通常所的说的CCD尺寸、CMOS尺寸,常见的有2/3英寸,1/1

Photoshop绘制精致金属边框水晶球按钮

限于喜欢 提交于 2020-02-10 04:09:37
  下面开始制作:   在PS中新建立一个250*250的文件,背景色选用白色。   创建一个新图层命名为“颜色渐变”。   按CTRL+R打开标尺,从X,Y轴分别拖拉出参考线,将参考线移动至文件中心位置,然后在中心位置按SHIFT+ALT键用椭圆选区工具作出正圆选区。(在拉出椭圆选区之前,先在把选择区在属性栏的数值样式设置为固定大小为152*152像素)   按CTRL+H暂时隐藏参考线。   在“颜色渐变”图层中用渐变工具在选择区内作出由黑到白的渐变,注意下拖动的方向。   结果因该和下面这样差不多   在保持选择的情况下建立一个新图层命名为“内阴影”,并用黑色对内部进行描边2像素处理(编辑-描边),然后用高斯模糊3个像素(滤镜-模糊-高斯模糊)。   按CTRL+D取消选择。   下面来制作内部的高光和反射光。   新建立一个图层组叫做球内高光。   在图层组中建立一个图层名为“底部高光”。   在创建另一个新图层,暂不用命名。   在这个未命名的图层中,用椭圆工具建立一个固定大小为190*160像素的选择区,并用黑色填充,位置就象以下这样:   现在回到“底部高光”上这个图层上来进行编辑。   按CTRL单击颜色渐变图层,载如其选择区。   将这个圆形选择区收缩2个像素。(选择-修改-收缩)   现在按住CTRL+ALT键的点击之前做的那个未命名的黑色椭圆选区

Photoshop 透明按钮

人盡茶涼 提交于 2020-02-10 03:35:58
1. 主色调为暖橙色,以黄色及白色作为辅助色调,整体表现出很强的透明质感。 R :234 G:131 B:0 步骤 步骤01 执行菜单栏中的【文件】|【新建】命令,在弹出的对话框中设置【宽度】更改为400像素,【高度】为300像素,【分辨率】为72像素/英寸,新建一个空白画布。然后将画布填充为黄色(R:239,G:175,B:0)到橙色(R:254,G:138,B:0)的径向渐变。 步骤02 选择工具箱中的【圆角矩形工具】,在选项栏中将【填充】更改为白色,【描边】更改为无,【半径】更改为50像素,绘制一个圆角矩形,此时将生成一个【圆角矩形1】图层 步骤03 在【图层】面板中选中【圆角矩形1】图层,将其拖至面板底部的【创建新图层】按钮上,复制一个【圆角矩形1拷贝】图层,分别将其图层名称更改为【高光】、【轮廓】 步骤04 在【图层】面板中选中【轮廓】图层,单击面板底部的【添加图层样式】按钮,在菜单中选择【内发光】命令,在弹出的对话框中将【混合模式】更改为【正常】,【不透明度】更改为100%,【颜色】更改为黄色(R:253,G:244,B:0),【大小】更改为10像素 步骤05 选中【渐变叠加】复选框,将【渐变】更改为橙色(R:254,G:138,B:0)到橙色(R:254,G:138,B:0),将第2个色标的【不透明度】更改为0% 步骤06 选中【外发光】复选框,将【混合模式

流媒体相关基础知识

好久不见. 提交于 2020-02-09 14:03:52
流媒体相关基础知识 分辨率、像素、480/720/1080P 帧率 分辨率、像素、480/720/1080P P:表示逐行扫描 (progressive scan) 480P 分辨率:640*480 = 30万像素 720P 分辨率:1280*720 = 921600 92万像素 1080P 分辨率:1920*1080 = 2073600 200万像素 接近2K 4K 分辨率:4096*2160 = 8847360 800万像素 4个2K 帧率 帧率或者称FPS:是指每秒显示的图片数。25以上人眼感觉在视频连续播放。帧率越高越流畅、逼真。30可以接受,60更逼真。超过75一般感觉不到流畅度提升。超过显示器刷新率浪费。 来源: CSDN 作者: weixin_41565133 链接: https://blog.csdn.net/weixin_41565133/article/details/104232869