图像处理

FPGA实现图像灰度转换(1):RGB分量转Gray

一个人想着一个人 提交于 2021-02-12 04:27:35
  Gray灰度图像:即我们常说的黑白图像,由黑到白的灰阶为 0- 255(8bit)。   本博客整理一下 RGB 分量实现 Gray 灰度效果的实验,这个实验非常的简单,简单到看到代码就感觉非常无语...... 一、RGB分量转Gray灰度的原理   RGB格式即一个像素由R、G、B三基色构成,例如 RGB565 格式的像素排列为R[4:0]、G[5:0]、B[4:0],RGB三个分量的数值不同,最后合成的像素颜色则不同。   RGB分量转Gray灰度即只挑取 R 或 G 或 B 的 1 个分量,剩下的 2 个分量丢弃,其位置由挑取的分量来替代。 二、MATLAB   此次实验选择了一张 RGB 分量明显的图片,先从 MATLAB 软件中查看效果如何。代码如下所示: clc; clear all; RGB = imread( ' flower.bmp ' ); % 读取图像 R_gray = RGB(:,:, 1 ); % 提取R分量后的灰度图 G_gray = RGB(:,:, 2 ); % 提取G分量后的灰度图 B_gray = RGB(:,:, 3 ); % 提取B分量后的灰度图 subplot( 2 , 2 , 1 );imshow(RGB); title( ' 原图 ' ); subplot( 2 , 2 , 2 );imshow(R_gray);title( '

opencv+python制作硬核七夕礼物

被刻印的时光 ゝ 提交于 2021-02-11 01:45:31
点击上方 “ AI算法与图像处理 ”,选择加"星标"或“置顶” 重磅干货,第一时间送达 来源:OpenCV视觉实践 明天就是七夕了! 如果有对象,祝早生贵子! 没有对象,祝早结连理! (搞笑一下,祝大家幸福美满吧,嘿嘿嘿) 给大家准备了一份已经写好的代码,利用python+opencv+openpyxl,opencv实现读取图片像素颜色,然后 openpyxl 自动填充Excel表格对应单元格背景颜色,得到一副Excel填充图画。文末代码下载链接。 先来看看效果叭(gif动图)! 把图片换成女朋友的真人图像会更逼真,会更加更好看。 然后看代码叭! 配置环境 我们需要用到python以及openpyxl和opencv包,没有下载的小伙伴可以去配置一下,超级简单: 大概就是在python终端(看个人环境)执行: pip install opencv-python pip install openpyxl 下面是我安装openpyxl包的录屏,可以参考一下,也可以跳过。 配置完成后就是导入我们需要的包了,这儿不需要过多了解: #导入opencv和openpyxl import openpyxl import cv2 as cv import numpy as np from openpyxl import load_workbook from openpyxl import

卷积神经网络(CNN)之一维卷积、二维卷积、三维卷积详解

怎甘沉沦 提交于 2021-02-10 22:51:33
作者:szx_spark 由于计算机视觉的大红大紫,二维卷积的用处范围最广。因此本文首先介绍二维卷积,之后再介绍一维卷积与三维卷积的具体流程,并描述其各自的具体应用。 1. 二维卷积 图中的输入的数据维度为$14\times 14$,过滤器大小为$5\times 5$,二者做卷积,输出的数据维度为$10\times 10$($14-5+1=10$)。如果你对卷积维度的计算不清楚,可以参考我之前的博客 吴恩达深度学习笔记(deeplearning.ai)之卷积神经网络(CNN)(上) 。 上述内容没有引入channel的概念,也可以说channel的数量为1。如果将二维卷积中输入的channel的数量变为3,即输入的数据维度变为($14\times 14\times 3$)。由于卷积操作中过滤器的channel数量必须与输入数据的channel数量 相同 ,过滤器大小也变为$5\times 5\times 3$。在卷积的过程中,过滤器与数据在channel方向分别卷积,之后将卷积后的数值相加,即执行$10\times 10$次3个数值相加的操作,最终输出的数据维度为$10\times 10$。 以上都是在过滤器数量为1的情况下所进行的讨论。如果将过滤器的数量增加至16,即16个大小为$10\times 10\times 3$的过滤器,最终输出的数据维度就变为$10\times 10

Python和JavaScript——这两种流行的编程语言之间的主要区别是什么?

怎甘沉沦 提交于 2021-02-09 19:04:37
如果你想了解Python和JavaScript之间的区别,那么本文适合你。 这两种语言非常流行且功能强大,但是它们之间确实存在关键差异,我们将在这里详细介绍它们。 在本文中,你将学习: Python和JavaScript在现实世界中的不同应用。 Python和JavaScript之间关键的语法和功能差异。 让我们开始! ✨ Python VS JavaScript:实际应用 我们将从快速浏览它们的实际应用程序开始。 Python 由于其强大的功能和多功能性,Python已经成为世界上几乎每一个科学应用程序中必不可少的工具,它是一种支持不同编程范式的通用编程语言。 它广泛用于科学和专业应用,包括数据科学、人工智能、机器学习、计算机科学教育、计算机视觉和图像处理、医学、生物学甚至天文学。 它还用于Web开发,这是我们可以开始将其应用程序与JavaScript应用程序进行比较的地方。Python用于后端开发,这是Web开发领域,负责创建用户看不见的元素,例如应用程序的服务器端。 JavaScript 尽管可以使用Python开发Web应用程序的后端部分,但是可以使用JavaScript开发应用程序的后端和前端。 前端是用户看到并与之交互的应用程序部分。每当你看到网站或Web应用程序或与之交互时,即在“幕后”使用JavaScript。 同样,当你与移动应用程序进行交互时

脑信号处理必备技能:由浅入深掌握傅里叶变换、短时傅里叶变换和小波变换(修改)

只愿长相守 提交于 2021-02-07 17:05:46
点击上面"脑机接口社区"关注我们 更多技术干货第一时间送达 作者丨咚懂咚懂咚@知乎(已授权),未经允许,禁止二次转载 来源丨https://zhuanlan.zhihu.com/p/22450818 编辑丨脑机接口社区 对脑电信号处理时,大家不可避免的会用到一些信号处理方法,其中小波变换在脑电信号处理中比较常用的方法。本文作者按照傅里叶-短时傅里叶变换-小波变换顺序,由浅入深,通俗易懂的解释了小波变换的相关知识。 从傅里叶变换到小波变换,并不是一个完全抽象的东西,可以讲得很形象。小波变换有着明确的物理意义,如果我们从它的提出时所面对的问题看起,可以整理出非常清晰的思路。 下面我就按照傅里叶-->短时傅里叶变换-->小波变换的顺序,讲一下为什么会出现小波这个东西、小波究竟是怎样的思路。(反正题主要求的是通俗形象,没说简短,希望不会太长不看。。) 01 傅里叶变换 关于傅里叶变换的基本概念在此我就不再赘述了,默认大家现在正处在理解了傅里叶但还没理解小波的道路上。(在第三节小波变换的地方我会再形象地讲一下傅里叶变换) 下面我们主要讲傅里叶变换的 不足。即我们知道傅里叶变化可以分析信号的频谱,那么为什么还要提出小波变换? 答案就是@方沁园所说的,“ 对非平稳过程,傅里叶变换有局限性 ”。看如下一个简单的信号: 做完FFT(快速傅里叶变换)后,可以在频谱上看到清晰的四条线

一文讲解图像插值算法原理!附Python实现

﹥>﹥吖頭↗ 提交于 2021-02-06 21:21:42
在图像处理中,几何变换是将一幅图像映射到另外一幅图像内的操作,可以大概分为放缩、翻转、仿射(平移、旋转)、透视、重映射几部分。 在几何变换时,无法给有些像素点直接赋值,例如,将图像放大两倍,必然会多出一些无法被直接映射的像素点,对于这些像素点,通过插值决定它们的值。且不同插值方式的结果不同。 在一幅输入图像[u,v]中,灰度值仅在整数位置上有定义。然而,输出图像的坐标映射回原图像后,一般为非整数的坐标。所以输出图像[x,y]的灰度值,一般由非整数坐标来决定,非整数坐标的像素值,就需要插值算法来进行处理。常见的插值算法有最近邻插值、双线性插值和三次样条插值。 本文目标 了解插值算法与常见几何变换之间的关系 理解插值算法的原理 掌握OpenCV框架下插值算法API的使用 插值算法原理介绍 近邻插值算法 1. 原理简介 将目标图像中的点,对应到原图像中后,找到最相邻的整数坐标点的像素值,作为该点的像素值输出。 如上图所示,目标图像中的某点投影到原图像中的位置为点P,与P距离最近的点为Q11,此时易知,f(P )=f(Q11)。 2. 例子说明 如图所示: 将一幅3*3图像放大到4*4,用f(x , y)表示原图像,h(x ,y)表示目标图像,我们有如下公式: 3. 缺点 由最邻近插值法,放大后的图像有很严重的马赛克,会出现明显的块状效应;缩小后的图像有很严重的失真。 这是一种最基本

用神经网络给照片补光,谷歌这项研究却实现了「鬼片」效果!(胆小勿入)

旧时模样 提交于 2021-02-05 06:05:44
打光是图像处理过程中的重要步骤,打光的好坏可能会影响整体效果的展示。打光方法也各有不同,MIT、谷歌等的一项新研究另辟蹊径,通过神经光传输方法进行图像的二次打光和视图合成,实现了相当不错的效果。 机器之心报道,编辑:魔王、杜伟、小舟。 图像合成早已不是新鲜话题,但是「打光」可是所有照片的难题。对于人类摄影师而言,打光就是件挺复杂的事,那么合成图像中的光线问题又该如何解决呢? 最近,来自 MIT、谷歌和加州大学圣地亚哥分校的研究人员进行了一项研究,试图 通过神经光传输(Neural Light Transport,NLT)对图像进行二次打光(relighting)和视图合成(view synthesis) 。 那么,这项研究提出的 NLT 方法效果如何呢?研究者在多个场景下进行了测试,包括 Directional Relighting、基于不同图像背景的打光、根据摄像头路径不同进行视图合成后的打光效果等等。 效果看起来不错,就是有点像鬼片……(瑟瑟发抖 具体而言,在 Directional Relighting 场景下,NLT 实现了如下效果: 在基于图像的 Relighting 场景下,人物的打光效果随着背景图像的变换而不断调整: 那么在涉及视图合成时,效果如何呢? 同时进行二次打光和视图合成呢? 想查看更多效果?请戳以下视频: https://v.qq.com/x/page

给女朋友买了只口红,结果她跟我说分手?掌握了机器学习再买买买吧!

↘锁芯ラ 提交于 2021-02-04 02:39:40
过完年,压岁钱到位,迟来的年终奖到账,钱包鼓起来但新的节日也不断跟上,情人节、元宵节、妇女节…… 说到底,还不是要买买买? 淘宝上的店铺又多又杂乱,一旦买错了, 面临的就是“女 ” 朋友的“果真直男审美 ” 的diss,或者人财两空的局面 接下去,来看看用机器学习技术如何甄别优质店铺,让你买到就是赚到! 分三步走: 第一步:找到阿里给出的店铺评价历史信息,分为训练集数据和测试集数据; 第二步:利用训练集数据构建机器学习模型; 第三步:使用测试集数据进行准确率判断并优化。 如此便可以建立一个相对科学的靠谱店铺预测模型。 首先,从阿里云天池开一份包含2000家店铺的评分,等级,评论等信息和数年交易记录的数据: 通过这份数据, 我们可以构建一套模型,根据店铺的访问、购买信息等数据,来评测该店铺是否为优质店铺。 一部分数据将用来作为训练集,另一部分数据会用来测试已经训练好模型的精确度。但训练的时候并不是精确度越高越好,过拟合和欠拟合都不是好事情。 欠拟合指模型没有很好地捕捉到数据特征,不能够很好地拟合数据: 过拟合通俗一点地说就是模型把数据学习的太彻底,以至于把噪声数据的特征也学习到了,这样就会导致在后期测试的时候不能够很好地识别数据,即不能正确的分类,模型泛化能力太差: 随后,完成了清理整合等预处理工作,得到了一份适合建模使用的样本数据: *完整代码可以在文末获取。考虑这份数据比较粗糙

智能驾驶仿真测试解决方案

微笑、不失礼 提交于 2021-02-03 11:38:17
概述 仿真测试验证作为智能驾驶系统开发流程中必不可少的一个环节,可以解决智能驾驶系统在测试过程中实车测试效率低、部分工况危险性高、实车测试成本高、工况无法复现等问题。智能驾驶概念涵盖了传统的高级驾驶辅助系统(ADAS)以及全自动驾驶系统(AD)。一般包括环境感知、智能决策及车辆控制三个部分。 经纬恒润推出的新一代智能驾驶 HIL仿真测试平台可以提供逼真的道路交通场景、高精度的车辆动力学模型以及多种形式的感知传感器仿真,可以满足从L1~L5 各级别智能驾驶系统的仿真测试需求。用户可以在此平台上建立丰富的智能驾驶测试场景,对感知、决策、车辆控制进行充分、高效的测试。 产品特点 ♦ 超强的实时处理能力,可运行多个决策算法控制的智能驾驶车辆,实现多车在环 ♦ 提供强大的CPU屏蔽功能,降低计算抖动,提供十微秒级别数据时延 ♦ 实时系统安装图形显卡,实现场景渲染与动力学低时延、高稳定性联合仿真 ♦ 模块化可扩展视频注入系统,支持多路摄像头视频仿真,单通道分辨率可达4k,支持EyeQ3\4等高复杂度芯片,支持美信、TI 、罗姆等主流编串芯片,支持DVP、GMSL、MIPI、FPDlink3 等主流数据传输方式,兼容原车摄像头视频采集、回注 ♦ 提供业内先进雷达模拟器系统,最近距离可达1.8m,信号带宽可达 5GHz,真正覆盖毫米波雷达测试工况;提供多雷达模拟器级联方案,解决 5R1V 测试需求

遥感图像处理

旧时模样 提交于 2021-02-03 11:02:21
2021年第一篇文章 基本概念 遥感 (Remote Sensing):遥远的感知,是一种远距离不直接接触物体而获取其信息的探测技术,主要是以电磁波为媒介,包括从紫外--可见光--红外--微波的范围。 DN值 (Digital Number ):遥感影像像元亮度值,记录地物的灰度值。 地表反射率 (Surface Albedo):地面反射辐射量与入射辐射量之比,表征地面对太阳辐射的吸收和反射能力。反射率越大,地面吸收太阳辐射越少;反射率越小,地面吸收太阳辐射越多。 表观反射率 (Apparent Reflectance):指大气层顶的反射率,辐射定标的结果之一,大气层顶表观反射率,简称表观反射率,又称视反射率。 亮度温度 (Brightness Temperature):是指和被测物体具有相同辐射强度的黑体所具有的温度,简称亮温。 地理编码 (Geo-coding):把图像矫正到一种统一标准的坐标系。 地理参照 (Geo-referencing):又叫图像纠正(Rectification),借助一组控制点,对一幅图像进行地理坐标的校正。 图像配准 (Registration):同一区域里一幅图像(基准图像)对另一幅图像校准,以使两幅图像中的同名像素配准。 图像存储方式 一般,传感器获取的遥感图像,包括通用型的二进制数据和一个说明性的头文件。 二进制数据形式主要有三种,分别是BIL