图像处理

计算机视觉、计算机图形学、图像处理的区别和联系

妖精的绣舞 提交于 2020-12-29 12:48:59
计算机视觉、计算机图形学、图像处理的区别和联系 搞了CV一段时间,仍时不时因为概念问题而困惑,搞不清楚计算机视觉(Computer Vision),计算机图形学(Computer Graphics)和图像处理(Image Processing)的区别和联系。在知乎上看到了一个帖子,觉得解释的很好,结合自己的理解,形成此文存档。 1.基本概念 从定义理解概念是最严谨的。所以首先搞清楚维基百科中这些概念的定义。 计算机视觉(CV): Computer vision is a field that includes methods for acquiring, processing, analyzing, and understanding images and, in general, high-dimensional data from the real world in order to produce numerical or symbolic information, e.g., in the forms of decisions.[1] 直译过来就是 计算机视觉是一个学科/领域,它包括获取、处理、分析和理解图像或者更一般意义的真实世界的高维数据的方法;它的目的是产生决策形式的数字或者符号信息。 计算机图像学(CG): Computer graphics is a sub

使用LEADTOOLS .NET Image SDK绘制和编辑注释

自作多情 提交于 2020-12-29 10:08:53
LEADTOOLS Recognition Imaging SDK是精选的LEADTOOLS SDK功能集,旨在在企业级文档自动化解决方案中构建端到端文档成像应用程序,这些解决方案需要OCR,MICR,OMR,条形码,表单识别和处理,PDF,打印捕获 ,档案,注释和图像查看功能。 这套功能强大的工具利用LEAD屡获殊荣的图像处理技术,智能识别可用于识别和提取任何类型的扫描或传真形式图像数据的文档功能。 点击下载LEADTOOLS Recognition Imaging SDK试用版【慧都网】 无论您的图像处理需求是什么,LEADTOOLS都有世界领先的SDK来完成所有繁重的工作。在以前的文章中,我们讨论了 查看图像, 保存图像, 将图像组合成一个文件以及 将一个文件拆分成多个图像。LEADTOOLS还可以在图像上绘制和编辑注释和标记对象。 在当今充满数字协作和图像共享的世界中,全面的注释支持至关重要。人们和组织全天使用各种类型的注释来引起对图像或文档特定方面的关注,并增强用户体验,生产力和安全性。该 LEADTOOLS注释库 支持标记对象和工具,包括高亮,参看附图,添加注释,进行测量,redacting或下划线的文本,以及更多的强大的集合。 下面的代码将帮助您入门,或者您随时可以查看我们有关图形注释的完整教程 。我们还将介绍 如何 为您的文档或图像创建自定义注释。 private

AI 基础:Scipy(科学计算库) 简易入门

空扰寡人 提交于 2020-12-28 11:38:40
0.导语 Scipy是一个用于数学、科学、工程领域的常用软件包,可以处理插值、积分、优化、图像处理、常微分方程数值解的求解、信号处理等问题。它用于有效计算Numpy矩阵,使Numpy和Scipy协同工作,高效解决问题。 Scipy是由针对特定任务的子模块组成: 在此之前,我已经写了以下几篇AI基础的快速入门,本篇文章讲解科学计算库Scipy快速入门: 已发布: AI 基础:Numpy 简易入门 AI 基础:Pandas 简易入门 AI基础:数据可视化简易入门(matplotlib和seaborn) 备注:本文代码可以在github下载 https://github.com/fengdu78/Data-Science-Notes/tree/master/4.scipy 1.SciPy-数值计算库 import numpy as np import pylab as pl import matplotlib as mpl mpl.rcParams['font.sans-serif'] = ['SimHei'] import scipy scipy.__version__#查看版本 '1.0.0' 常数和特殊函数 from scipy import constants as C print (C.c) # 真空中的光速 print (C.h) # 普朗克常数 299792458.0 6

GitHub 超 20000 Star,最火开源视频库 FFmpeg 这 20 年!

 ̄綄美尐妖づ 提交于 2020-12-28 01:23:16
【编者按】不知不觉,FFmpeg 已有 20 个年头了。这 20 年总体看来,FFmpeg 如今已非常成功,但期间也有一些波折。 项目发起人 Fabrice Bellard 曾带领部分开发团队脱离 FFmpeg ,创建新项目 libav ,直到后来 FFmpeg 项目负责人 Michael Niedermayer 将 libav 的代码合并到了 FFmpeg。除此之外,FFmpeg 的“耻辱柱”更是为人熟知,国内的暴风影音和 QQ 影音都曾上榜。 如今,尽管 FFmpeg 正在被基于他的应用慢慢取代,但他对于音视频等领域的影响依旧可见。技术升级换代促使社会进步,同样,FFmpeg 也在用自己的方式改善人们的生活…… 作者 | 陈超 责编 | 张文 头图 | CSDN 下载自视觉中国 出品 | CSDN(ID:CSDNnews) FFmpeg 20 年绝对是个历史厚重的话题,而且它涉及了很多人的利益,我们不作过多阐述。本文,我仅仅从一个从事音视频行业十多年的开发者,从一个 FFmepg 使用者的角度,结合自身经历,谈一谈自己的观点和看法,希望能给大家一些参考。 为什么让我来聊这个话题?一方面是因为我从业时间长,第二方面,我也是 FFmpeg 开源项目的受益者。所以无论从纯技术角度,还是从商业产品的角度,我都有小小的经验可以分享。 FFmpeg 由法国天才程序员 Fabrice

编程必备基础知识|计算机组成原理篇(02):计算机的分类

穿精又带淫゛_ 提交于 2020-12-27 09:03:03
计算机基础方面的知识,对于一些非科班出身的同学来讲,一直是他们心中的痛,而对于科班出身的同学,很多同学在工作之后,也意识到自身所学知识的不足与欠缺,想回头补补基础知识。关于计算机基础的课程很多,内容繁杂,但无论是相关书籍还是大学课程,都有点脱离工作。特别地,计算机基础知识体系庞杂,想要从零学习或者复习都耗时耗力。 有鉴于此,本系列文章将带你更快的补足编程必备基础知识,涵盖计算机领域三大基础知识:计算机组成原理、操作系统、计算机网络,文章选取了作为程序员最应该掌握的那部分知识,取其精华,弃之于程序员不重要的那部分内容。 目的是: 帮助大家形成计算机知识的结构体系 帮助大家理解计算机底层原理 帮助大家在工作实践中借鉴其中的优秀设计 本篇是计算机组成原理篇之计算机的分类。 欢迎关注、转发、收藏、评论 1.超级计算机 超级计算机是功能最强、运算速度最快、存储容量最大的计算机,多用于国家高科技领域和尖端技术研究,包括天气预报、海洋监测、生物制药、科学计算、核聚变核裂变模拟、加密解密算法的运算、军事战争模拟等等。 用来衡量超级计算机运算速度的单位是TFlop/s,1TFlop/s = 每秒一万亿次浮点计算。 截至目前,全世界超级计算机排名前三的见下图。 为什么神威太湖之光的处理器个数远超Summit,但算力还没有Summit高呢?这是因为神威太湖之光采用的全部是拥有自主知识产权的国产芯片。

高斯核 卷积

被刻印的时光 ゝ 提交于 2020-12-27 03:47:29
https://blog.csdn.net/dcrmg/article/details/52304446 原文: https://blog.csdn.net/weixin_39124778/article/details/78411314 计算 1)一维卷积: y(t)=g(k)*x(k)=$g(k)x(t-k) 先把函数x(k)相对于原点反折,然后向右移动距离t,然后两个函数相乘再积分,就得到了在t处的输出。对每个t值重复上述过程,就得到了输出曲线。 2)二维卷积: h(x,y)=f(u,v)*g(u,v)=$$f(u,v)g(x-u,y-v) 先将g(u,v)绕其原点旋转180度,然后平移其原点,u轴上像上平移x, v轴上像上平移y。然后两个函数相乘积分,得到一个点处的输出。 应用 图像处理:用一个模板和一幅图像进行卷积,对于图像上的一个点,让模板的原点和该点重合,然后模板上的点和图像上对应的点相乘,然后各点的积相加,就得到了该点的卷积值。对图像上的每个点都这样处理。由于大多数模板都是对称的,所以模板不旋转。卷积是一种积分运算,用来求两个曲线重叠区域面积。可以看作加权求和,可以用来消除噪声、特征增强。 把一个点的像素值用它周围的点的像素值的加权平均代替。 卷积是一种线性运算,图像处理中常见的mask运算都是卷积,广泛应用于图像滤波。 卷积在数据处理中用来平滑

卷积核的工作原理

丶灬走出姿态 提交于 2020-12-27 01:04:53
  卷积是图像处理中一个操作,是kernel在图像的每个像素上的操作。Kernel本质上一个固定大小的矩阵数组,其中心点称为锚点(anchor point)。把kernel放到像素数组之上,求锚点周围覆盖的像素乘积之和(包括锚点),用来替换锚点覆盖下像素点值称为卷积处理。数学表达如下: $${\rm{H}}\left( {x,y} \right) = \sum\limits_{i = 0}^{{M_i} - 1} {\sum\limits_{j = 0}^{{M_j} - 1} {I\left( {x + i - {a_i},y + j - {a_j}} \right)K\left( {i,j} \right)} }$$   Sum = 8x1+6x1+6x1+2x1+8x1+6x1+2x1+2x1+8x1。   中心锚点像素 = sum / (m*n)。 常用的算子包括 1.Sobel卷积核:   卷积效果如图所示: 2.Robert卷积核   卷积效果如图所示: 3.拉普拉斯算子   得到的是整个图像的差异,常用于边缘检测,获取轮廓。   卷积效果如下: 4.边缘处理   在卷积开始之前增加边缘像素,填充的像素值为0或者RGB黑色,比如3x3在四周各填充1个像素的边缘,这样就确保图像的边缘被处理,在卷积处理之后再去掉这些边缘。,图像卷积的时候边界像素,不能被卷积操作

一文带你了解传统手工特征的骨龄评估方法的发展历史

北战南征 提交于 2020-12-22 19:29:19
摘要 :基于传统手工特征的骨龄评估方法主要包括预处理、关键区域检测、手骨分割、特征提取、测量五个步骤。 基于传统手工特征的骨龄评估方法主要包括预处理、关键区域检测、手骨分割、特征提取、测量五个步骤,见图1,以下为该类方法的发展历史介绍。 图1 前人基于手工特征的骨龄评估方法的主要技术路线 1989年,Michael和Nelson共同开发了世界上第一套基于模型的半自动化手骨测量系统,并将其命名为HANDX。该系统包含了三个主要模块:预处理、分割和测量。首先构造直方图模型用于增强图像,使用高斯分布函数将图像大致分为三类:背景,软组织和骨骼;然后,采用自适应轮廓逼近算法逐步勾勒出每块骨骼的形状;最后,通过找到每块骨骼的长轴和短轴来计算测量值。HANDX系统需要基于手的位置作为先验知识输入到系统中,并未进行大规模的数据测试。 1991年,Pietka等人提出了一种基于测量指骨长度来估计骨龄的简便方法。通过对二值化后的图像缩小范围,确定大致的指骨及其骨骺感兴趣区(phalangeal ROI,PROI)并对图像进行旋转,获得大致PROI垂直正位X光片,使用Sobel梯度算子进行边缘检测,根据经验选择合适的阈值,从而获得指骨及其骨骺的边缘图。然后根据中指位于图像最顶端的特性,找出中指的近端指骨、中端指骨和远端指骨并测量他们的长度。通过查阅中指的标准指骨长度表,对应给出大致估计的骨龄

图像特征提取(颜色,纹理,形状)

风格不统一 提交于 2020-12-22 05:24:17
点击上方 “ 机器学习与生成对抗网络 ”,关注"星标" 获取有趣、好玩的前沿干货! 来源 新机器视觉 来自 小白学视觉 编辑 王萌 深度学 习冲鸭 著作权归作者所有,文仅分享,侵 删 1.颜色特征提取 计算机视觉的特征提取算法研究至关重要。在一些算法中,一个高复杂度特征的提取可能能够解决问题(进行目标检测等目的),但这将以处理更多数据,需要更高的处理效果为代价。而颜色特征无需进行大量计算。只需将数字图像中的像素值进行相应转换,表现为数值即可。因此颜色特征以其低复杂度成为了一个较好的特征。 在图像处理中,我们可以将一个具体的像素点所呈现的颜色分多种方法分析,并提取出其颜色特征分量。比如通过手工标记区域提取一个特定区域(region)的颜色特征,用该区域在一个颜色空间三个分量各自的平均值表示,或者可以建立三个颜色直方图等方法。下面我们介绍一下颜色直方图和颜色矩的概念。 (1)颜色直方图: 颜色直方图用以反映图像颜色的组成分布,即各种颜色出现的概率。Swain和Ballard最先提出了应用颜色直方图进行图像特征提取的方法[40],首先利用颜色空间三个分量的剥离得到颜色直方图,之后通过观察实验数据发现将图像进行旋转变换、缩放变换、模糊变换后图像的颜色直方图改变不大,即图像直方图对图像的物理变换是不敏感的。因此常提取颜色特征并用颜色直方图应用于衡量和比较两幅图像的全局差。另外

图像特征提取(颜色,纹理,形状)

我的未来我决定 提交于 2020-12-22 05:21:35
点击上方 “ 小白学视觉 ”,选择加" 星标 "或“ 置顶 ” 重磅干货,第一时间送达 转自 | 新机器视觉 1.颜色特征提取 计算机视觉的特征提取算法研究至关重要。在一些算法中,一个高复杂度特征的提取可能能够解决问题(进行目标检测等目的),但这将以处理更多数据,需要更高的处理效果为代价。而颜色特征无需进行大量计算。只需将数字图像中的像素值进行相应转换,表现为数值即可。因此颜色特征以其低复杂度成为了一个较好的特征。 在图像处理中,我们可以将一个具体的像素点所呈现的颜色分多种方法分析,并提取出其颜色特征分量。比如通过手工标记区域提取一个特定区域(region)的颜色特征,用该区域在一个颜色空间三个分量各自的平均值表示,或者可以建立三个颜色直方图等方法。下面我们介绍一下颜色直方图和颜色矩的概念。 (1)颜色直方图: 颜色直方图用以反映图像颜色的组成分布,即各种颜色出现的概率。Swain和Ballard最先提出了应用颜色直方图进行图像特征提取的方法[40],首先利用颜色空间三个分量的剥离得到颜色直方图,之后通过观察实验数据发现将图像进行旋转变换、缩放变换、模糊变换后图像的颜色直方图改变不大,即图像直方图对图像的物理变换是不敏感的。因此常提取颜色特征并用颜色直方图应用于衡量和比较两幅图像的全局差。另外,如果图像可以分为多个区域,并且前景与背景颜色分布具有明显差异,则颜色直方图呈现双峰形。