图像处理

编程正式进入中考模式!北京海淀:通过信息技术考试方可毕业

隐身守侯 提交于 2020-12-20 17:41:57
作者 | 极客日报 出品 | CSDN 博客 编程正式进入中考模式! 2020年11月,北京市海淀区教育委员会办公室印发《北京市海淀区初中音乐、美术、信息技术、劳动技术学业水平考试实施方案》的通知,其中规定信息技术考试中包括程序设计。 初中音乐、美术、信息技术和劳动技术学业水平考试主要衡量学生达到国家规定学习要求的程度,考试成绩用于学生初中毕业认定和学校自主招生。 初中信息技术学业水平考试内容主要包括信息技术基础、数据处理、程序设计、图像处理、音视频处理五个部分,且该文件中明确指出:该考试不合格,将影响毕业证书的颁发。 由此可见,中小学生掌握信息学技术,一定是未来的主流趋势。 信息技术学业水平考试成绩:涉及毕业认定和自主招生。 事实上,不仅是海淀区,早在今年3月,北京市教委就发布了《北京市初中学业水平考试实施办法》,宣布2021年北京市将中考和毕业会考合二为一,统一为学业水平考试。并且,《义务教育课程设置实验方案》所设定的全部科目都将纳入初中学业水平考试范围。 包含传统意义上的学科如语文、数学、外语、道德与法治、历史、地理、物理、化学、生物、体育与健康在内,艺术(音乐、美术)、综合实践活动(信息技术和劳动技术)也都将成为必考科目。 虽然目前来看艺术和综合实践活动这两门课程的成绩仅以等级成绩呈现,不参与中招录取,但在今年3月的《办法》中也明确,等级成绩将主要用于毕业认定和自主招生。

安谋中国发布“玲珑”i3i5 ISP处理器,剑指何方?

本秂侑毒 提交于 2020-12-18 12:00:59
随着图像视频处理技术的发展和 5G 时代的来临,除了社交等平台外,以图像、视频为载体的内容渗透到各领域,特别是智能安防、AIoT、智能汽车等新兴领域应用。与此同时,人们对其清晰度、图像分辨率有新的扩展需求,对摄像头、人机交互等的需求也逐渐提高。 对此,安谋中国产品研发常务副总裁刘澍表示:“如此大规模数量的图像和图形的处理需求,将使多媒体产品长期有生命力。对于新兴的领域,以后的图像不仅是给人来看,还会给机器来看。因此对图像和机器的交互、人和机器的交互,以及虚拟现实中对虚拟和现实图景的交互上,对不同场景的画质处理、读者感官上的处理、机器感官上的处理都有很大的不同。” 基于此,安谋中国历时2年多自主研发出“玲珑”i3/i5 ISP处理器,针对安防监控场景对图像的需求进行优化,有针对性地提升了降噪、动态范围、清晰度等主 要指标,具有高画质、低延时、高兼容性、易扩展、面积精简和低系统带宽等特点。 当前国内不少厂商进行 ISP 处理器研发,安谋中国为何现在才入局? 刘澍表示,尽管图像处理未来的应用领域和空间非常巨大。一分为二来看,没有这些技术的公司还很多,据半导体行业协会统计,中国有 1800 多家半导体设计公司。其中有较多技术积累的公司仅是少数,大部分的公司有创新和设计需求,我们的产品需满足大多数公司的需求。其次,尽管有不少的公司在ISP图像图形处理上有深入的研究,而“玲珑

你的二次元老婆,被AI变成了暗黑系

拜拜、爱过 提交于 2020-12-18 02:44:05
鱼羊 萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 现在,AI对光影的理解越来越深入了。 不仅能自动给二次元萌妹的线稿上色,绘制出合理的光影变化。 反向操作,提取图片中的纹理和光影也不在话下。 大师级作品、或是摄影海报,只需要拿过来「扫描」一下,就能分解出纯色层、阴影层和反射层。 这下,想要调整图片的纹理和光影,再也不用苦恼没有psd、图层被合并了。 这只全新AI的一作,还是那位打造了火遍二次元圈的自动线稿上色AI Style2Paints 的Lvmin Zhang小哥。 论文已经中了ECCV 2020 Spotlight。 抠掉多余的像素 分解图像最需要解决的问题,就是图像平滑,它能让图像变得更模糊,但与此同时,调节光影、纹理也变得更容易。 而图像平滑的核心问题,可以被理解成 估计图像中的像素是否被需要 。 图像平滑 换种说法,图像平滑要解决的最大问题,是在 图像去噪 和 外观保留 这两者之间,找一个平衡点。 也就是说,与锐化相反,平滑既要最大程度上保留图像的本质,又希望能消除图像的噪音。 下图就是经过平滑处理的一张图像。可以看见,即使平滑处理后的图像变得模糊不清,我们依稀能辨认出这是一片海。 那么,平滑图像究竟有什么用? 看,调节色温方便多了,让图中的天和海从蓝变绿再变紫,看起来都不是问题。 此外,图像平滑也是图像处理中纹理去除、材料处理、重新着色

基于opencv,开发摄像头播放程序

大兔子大兔子 提交于 2020-12-16 23:48:18
前言 Windows下实现摄像视频捕捉有多种实现方式;各种方式的优劣,本文不做对比。但是,opencv是一款老牌开发库,在图像处理领域声名显赫。采用opencv来处理摄像视频,在性能和稳定性上,是有保障的。并且,opencv包含很多图像处理函数,可以更方便的对视频处理。   执行程序是用wpf开发的,所以先将opencv封装成c语言接口,以供调用。opencv也不可能提供现成的控件供wpf使用,两种不同的开发语言“沟通”起来有些困难。其实稍作变通,就可以实现摄像头播放功能。 1 对opencv封装 opencv的类VideoCapture封装了对摄像头的操作,使用起来也非常简单。 bool open(int device); device为摄像头设备序号。 如果有多个摄像头,怎么知道哪个摄像头的序号那?可以通过如下函数,获取摄像头列表。摄像头在list中索引即为设备序号。 int GetCameraDevices(vector<wstring>& list) { ICreateDevEnum *pDevEnum = NULL; IEnumMoniker *pEnum = NULL; int deviceCounter = 0 ; CoInitialize(NULL); HRESULT hr = CoCreateInstance(CLSID_SystemDeviceEnum,

机器学习和计算机视觉的前20个图像数据集

拈花ヽ惹草 提交于 2020-12-16 12:12:56
计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类视觉系统可以完成的任务自动化。 计算机视觉任务包括图像采集,图像处理和图像分析。图像数据可以采用不同的形式,例如视频序列,从多个角度不同的摄像机查看的图像或来自医疗扫描仪的多维数据。 用于计算机视觉训练的图像数据集 Labelme: 由 MIT 计算机科学和人工智能实验室( CSAIL )创建的大型数据集,包含 187,240 张图像, 62,197 条带注释的图像和 658,992 张带标签的对象。 http://labelme.csail.mit.edu/Release3.0/browserTools/php/dataset.php 乐高积木: 通过文件夹和使用 Blender 渲染的计算机对 16 种不同乐高积木进行分类的大约 12,700 张图像。 https://www.kaggle.com/joosthazelzet/lego-brick-images ImageNet: 用于新算法的实际图像数据集。根据 WordNet 层次结构进行组织,其中层次结构的每个节点都以成千上万的图像进行描绘。 http://image-net.org/ LSUN : 场景理解和许多辅助任务(房间布局估计,显着性预测等) http://lsun.cs.princeton.edu/2016/ MS COCO : COCO

图像与滤波

半世苍凉 提交于 2020-12-16 09:17:56
图像与滤波 转载于 阮一峰老师的博客 我对图像处理一直很感兴趣,曾经写过好几篇博客( 1 , 2 , 3 , 4 )。 前几天读到一篇 文章 ,它提到 图像其实是一种波,可以用波的算法处理图像 。我顿时有一种醍醐灌顶的感觉,从没想到这两个领域是相关的,图像还可以这样玩!下面我就来详细介绍这篇文章。 一、为什么图像是波? 我们知道,图像由像素组成。下图是一张 400 x 400 的图片,一共包含了 16 万个像素点。 每个像素的颜色,可以用红、绿、蓝、透明度四个值描述,大小范围都是 0 ~ 255 ,比如黑色是 [0, 0, 0, 255] ,白色是 [255, 255, 255, 255] 。通过 Canvas API 就可以拿到这些值。 如果把每一行所有像素(上例是400个)的红、绿、蓝的值,依次画成三条曲线,就得到了下面的图形。 可以看到,每条曲线都在不停的上下波动。有些区域的波动比较小,有些区域突然出现了大幅波动(比如 54 和 324 这两点)。 对比一下图像就能发现,曲线波动较大的地方,也是图像出现突变的地方。 这说明波动与图像是紧密关联的。 图像本质上就是各种色彩波的叠加。 二、频率 综上所述,图像就是色彩的波动:波动大,就是色彩急剧变化;波动小,就是色彩平滑过渡。因此,波的各种指标可以用来描述图像。 频率(frequency)是波动快慢的指标,单位时间内波动次数越多

再小的应用也有架构,面向架构新手的架构实践!

…衆ロ難τιáo~ 提交于 2020-12-15 01:41:30
文章主人公:小明,就职于某互联网公司,从事后端开发工作。最近小明收到通知公司需要开发一款《证件照》应用,需要征集架构方案,主要功能包括: 小明虽然从事后端开发工作,但是一直很关注架构这方面的知识,以往都是开发大佬们架构好的应用现在有机会自己去实践下,打算把自己学到的知识应用于实际案例中来。 小明的脑海里是回想了下架构的基本三原则: 合适优于业界领先 简单优于复杂 演化优于一步到位 小明作为架构新手,虽然干劲十足,但是也像大部分一样开发人员一样架构经验较少,不知道如何下手去开始架构,万事开头难啊!小明请教了下公司的西踢殴(CTO),给了一句25字的架构真言: 架构设计的主要目的是为了解决软件系统复杂度带来的问题 小明也算骨骼惊奇,久经沙场(996没少锻炼人~~),思考了“架构真言”既然是为了解决软件系统繁杂度的问题,那不得先找出系统的复杂点在哪里吗? 发现复杂点 小明根据“架构真言”开始思考《证件照》应用的复杂点,首先它是一款工具类应用,主要功能是进行图像处理: 小明发现图像处理和图像存储可能比较复杂,公司现阶段没有专门做图像处理团队,也没有大数据团队,这两个问题是要优先解决的问题。 小明现在使用的手机是 Galaxy s9 一张照片大概是6m,如果初期应用日活1w,假设有20%的人会处理图片,那一天的存储量大约10g,运行一个月就需要300g的存储空间

再小的应用也有架构,面向架构新手的架构实践!

大憨熊 提交于 2020-12-14 12:22:11
文章主人公:小明,就职于某互联网公司,从事后端开发工作。最近小明收到通知公司需要开发一款《证件照》应用,需要征集架构方案,主要功能包括: 小明虽然从事后端开发工作,但是一直很关注架构这方面的知识,以往都是开发大佬们架构好的应用现在有机会自己去实践下,打算把自己学到的知识应用于实际案例中来。 小明的脑海里是回想了下架构的基本三原则: 合适优于业界领先 简单优于复杂 演化优于一步到位 小明作为架构新手,虽然干劲十足,但是也像大部分一样开发人员一样架构经验较少,不知道如何下手去开始架构,万事开头难啊!小明请教了下公司的西踢殴(CTO),给了一句25字的架构真言:架构设计的主要目的是为了解决软件系统复杂度带来的问题 小明也算骨骼惊奇,久经沙场(996没少锻炼人~~),思考了“架构真言”既然是为了解决软件系统繁杂度的问题,那不得先找出系统的复杂点在哪里吗? 发现复杂点 小明根据“架构真言”开始思考《证件照》应用的复杂点,首先它是一款工具类应用,主要功能是进行图像处理: 小明发现图像处理和图像存储可能比较复杂,公司现阶段没有专门做图像处理团队,也没有大数据团队,这两个问题是要优先解决的问题。 小明现在使用的手机是Galaxy s9一张照片大概是6m,如果初期应用日活1w,假设有20%的人会处理图片,那一天的存储量大约10g,运行一个月就需要300g的存储空间

FPGA与LVDS信号兼容性分析方法

断了今生、忘了曾经 提交于 2020-12-14 06:08:02
很多工程师在使用Xilinx开发板时都注意到了一个问题,就是开发板中将LVDS的时钟输入(1.8V电平)连接到了VCCO=2.5V或者3.3V的Bank上,于是产生了关于FPGA引脚与LVDS(以及LVDS-33,LVDS-25)信号相连时兼容性的问题,该专题就解决一下这类问题。总的来说,只要按照下面图 1和图 2流程进行判断即可。 这里补充一点知识,Xilinx的FPGA从7系开始分HR IO Bank和HP IO Bank,其中HR(High Range)Bank支持1.2V,1.5V,1.8V,2.5V以及3.3V供电;而HP(High Performance)Bank只支持1.2V,1.5V,1.8V供电,不再支持2.5V和3.3V供电。 图 1 图 2 针对LVDS的兼容性,图 1和图 2已经可以解决绝大多数问题了,这里做一些补充和解释。 很明确的结论:作为输入引脚时,VCCO不等于1.8V的Bank有可能可以连接LVDS电平标准输入;VCCO不等于2.5V的Bank有可能可以连接LVDS_25电平标准输入。但是作为LVDS输出引脚时, 相应Bank的VCCO必须与电平标准的电压相匹配。 VCCO是IO Bank的Output Driver的驱动电源,Input Receiver中部分功能是由VCCAUX供电的。这就解释了为什么作为输入引脚时,电平标准可以与VCCO不匹配

CVPR2020丨UDVD:用于可变退化的统一动态卷积超分辨率网络

我是研究僧i 提交于 2020-12-13 11:04:37
点击上方“ AI公园 ”,选择“ 星标★ ”公众号 重磅干货,第一时间送达 CVPR2020论文:Unified Dynamic Convolutional Network for Super-Resolution with Variational Degradations 论文:https://arxiv.org/pdf/2004.06965.pdf 近些年,基于CNN的方法在图像超分辨率问题上表现出出色的性能。然而大多数方法基于一种退化或者是多种退化的组合,甚至去训练特定的模型以适应特定的退化过程。因此更加实际的方法是训练单独的模型以适用多样可变的退化。 因此为了实现这个目标,论文提出了一个统一网络去适应 图像间 (跨图像变化)和 图像内 (空间变化)的变化。 如何实现呢?论文首先提出了动态卷积,进而基于动态卷积提出了用于可变退化的统一可变卷积网络(UDVD)。从 图1 可以看到UDVD 针对不同退化,都能够生成良好的结果,而 RCAN、ZSSR 则无法很好地应对多种退化过程。 图1. UDVD 与RCAN ZSSR 生成图像细节对比 退化LR图像生成 为了训练模型,首先需要对HR 图像处理,生成退化的LR 图像。退化过程可以由如下公式定义: 表示模糊核, 表示下采样过程, 表示噪声, 分别为低分辨率图像和原始高分辨率图像。论文选取了各向同性高斯模糊核以及加性高斯白噪声