python PIL 图像处理
This blog is from: https://www.jianshu.com/p/e8d058767dfa
Image读出来的是PIL的类型,而skimage.io读出来的数据是numpy格式的
#Image和skimage读图片 import Image as img import os from matplotlib import pyplot as plot from skimage import io,transform img_file1 = img.open('./CXR_png/MCUCXR_0042_0.png') img_file2 = io.imread('./CXR_png/MCUCXR_0042_0.png')
输出可以看出Img读图片的大小是图片的(width, height);而skimage的是(height,width, channel), [这也是为什么caffe在单独测试时要要在代码中设置:transformer.set_transpose('data',(2,0,1)),因为caffe可以处理的图片的数据格式是(channel,height,width),所以要转换数据]
#读图片后数据的大小: print "the picture's size: ", img_file1.size print "the picture's shape: ", img_file2.shape
the picture's size: (4892, 4020) the picture's shape: (4020, 4892)
#得到像素: print(img_file1.getpixel((500,1000)), img_file2[500][1000]) print(img_file1.getpixel((500,1000)), img_file2[1000][500]) print(img_file1.getpixel((1000,500)), img_file2[500][1000])
(0, 139) (0, 0) (139, 139)
Img读出来的图片获得某点像素用getpixel((w,h))可以直接返回这个点三个通道的像素值
skimage读出来的图片可以直接img_file2[0][0]获得,但是一定记住它的格式,并不是你想的(channel,height,width)
在图片上面加文字
#新建绘图对象 draw = ImageDraw.Draw(image), #获取图像的宽和高 width, height = image.size; #** ImageFont模块** #选择文字字体和大小 setFont = ImageFont.truetype('C:/windows/fonts/Dengl.ttf', 20), #设置文字颜色 fillColor = "#ff0000" #写入文字 draw.text((40, height - 100), u'广告', font=setFont, fill=fillColor) 作者:刑素素 链接:http://www.jianshu.com/p/c77315a5435f 來源:简书 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
图片信息
如果我们想知道一些skimage图片信息
from skimage import io, data img = data.chelsea() io.imshow(img) print(type(img)) #显示类型 print(img.shape) #显示尺寸 print(img.shape[0]) #图片高度 print(img.shape[1]) #图片宽度 print(img.shape[2]) #图片通道数 print(img.size) #显示总像素个数 print(img.max()) #最大像素值 print(img.min()) #最小像素值 print(img.mean()) #像素平均值 print(img[0][0])#图像的像素值
PIL image 查看图片信息,可用如下的方法
print type(img) print img.size #图片的尺寸 print img.mode #图片的模式 print img.format #图片的格式 print(img.getpixel((0,0)))#得到像素: #img读出来的图片获得某点像素用getpixel((w,h))可以直接返回这个点三个通道的像素值
# 获取图像的灰度值范围 width = img.size[0] height = img.size[1] # 输出图片的像素值 count = 0 for i in range(0, width): for j in range(0, height): if img.getpixel((i, j))>=0 and img.getpixel((i, j))<=255: count +=1 print count print(height*width)
使用python进行数字图片处理,还得安装Pillow包。虽然python里面自带一个PIL(python images library), 但这个库现在已经停止更新了,所以使用Pillow, 它是由PIL发展而来的。
pil能处理的图片类型
pil可以处理光栅图片(像素数据组成的的块)。
通道
一个图片可以包含一到多个数据通道,如果这些通道具有相同的维数和深度,Pil允许将这些通道进行叠加
模式 1 1位像素,黑和白,存成8位的像素 L 8位像素,黑白 P 8位像素,使用调色板映射到任何其他模式 RGB 3×8位像素,真彩 RGBA 4×8位像素,真彩+透明通道 CMYK 4×8位像素,颜色隔离 YCbCr 3×8位像素,彩色视频格式 I 32位整型像素 F 32位浮点型像素
坐标
Pil采取左上角为(0,0)的坐标系统
图片的打开与显示
from PIL import Image img=Image.open('d:/dog.png') img.show()
虽然使用的是Pillow,但它是由PIL fork而来,因此还是要从PIL中进行import. 使用open()函数来打开图片,使用show()函数来显示图片。
这种图片显示方式是调用操作系统自带的图片浏览器来打开图片,有些时候这种方式不太方便,因此我们也可以使用另上一种方式,让程序来绘制图片。
from PIL import Image import matplotlib.pyplot as plt img=Image.open('d:/dog.png') plt.figure("dog") plt.figure(num=1, figsize=(8,5),) plt.title('The image title') plt.axis('off') # 不显示坐标轴 plt.imshow(img) plt.show()
这种方法虽然复杂了些,但推荐使用这种方法,它使用一个matplotlib的库来绘制图片进行显示。matplotlib是一个专业绘图的库,相当于matlab中的plot,可以设置多个figure,设置figure的标题,甚至可以使用subplot在一个figure中显示多张图片。matplotlib 可以直接安装.
figure默认是带axis的,如果没有需要,我们可以关掉
plt.axis('off')
图像加标题
plt.title('The image title')
matplotlib标准模式
plt.figure(num=5, figsize=(8,5),) #plt.figure(num='newimage', figsize=(8,5),) plt.title('The image title', color='#0000FF') plt.imshow(lena) # 显示图片 plt.axis('off') # 不显示坐标轴 plt.show()
PIL image 查看图片信息,可用如下的方法
print type(img) print img.size #图片的尺寸 print img.mode #图片的模式 print img.format #图片的格式
图片的保存
img.save('d:/dog.jpg')
就一行代码,非常简单。这行代码不仅能保存图片,还是转换格式,如本例中,就由原来的png图片保存为了jpg图片。
图像通道\几何变换\裁剪
PIL可以对图像的颜色进行转换,并支持诸如24位彩色、8位灰度图和二值图等模式,简单的转换可以通过Image.convert(mode)函数完 成,其中mode表示输出的颜色模式,例如''L''表示灰度,''1''表示二值图模式等。但是利用convert函数将灰度图转换为二值图时,是采用 固定的阈 值127来实现的,即灰度高于127的像素值为1,而灰度低于127的像素值为0。
彩色图像转灰度图
from PIL import Image import matplotlib.pyplot as plt img=Image.open('d:/ex.jpg') gray=img.convert('L') plt.figure("beauty") plt.imshow(gray,cmap='gray') plt.axis('off') plt.title('The color image to gray image') plt.show()
使用函数convert()来进行转换,它是图像实例对象的一个方法,接受一个 mode 参数,用以指定一种色彩模式,mode 的取值可以是如下几种:
· 1 (1-bit pixels, black and white, stored with one pixel per byte) · L (8-bit pixels, black and white) · P (8-bit pixels, mapped to any other mode using a colour palette) · RGB (3x8-bit pixels, true colour) · RGBA (4x8-bit pixels, true colour with transparency mask) · CMYK (4x8-bit pixels, colour separation) · YCbCr (3x8-bit pixels, colour video format) · I (32-bit signed integer pixels) · F (32-bit floating point pixels)
通道分离与合并
from PIL import Image import matplotlib.pyplot as plt img=Image.open('d:/ex.jpg') #打开图像 gray=img.convert('L') #转换成灰度 r,g,b=img.split() #分离三通道 pic=Image.merge('RGB',(r,g,b)) #合并三通道 plt.figure("beauty") plt.subplot(2,3,1), plt.title('origin') plt.imshow(img),plt.axis('off') plt.subplot(2,3,2), plt.title('gray') plt.imshow(gray,cmap='gray'),plt.axis('off') plt.subplot(2,3,3), plt.title('merge') plt.imshow(pic),plt.axis('off') plt.subplot(2,3,4), plt.title('r') plt.imshow(r,cmap='gray'),plt.axis('off') plt.subplot(2,3,5), plt.title('g') plt.imshow(g,cmap='gray'),plt.axis('off') plt.subplot(2,3,6), plt.title('b') plt.imshow(b,cmap='gray'),plt.axis('off') plt.show()
裁剪图片
从原图片中裁剪感兴趣区域(roi),裁剪区域由4-tuple决定,该tuple中信息为(left, upper, right, lower)。 Pillow左边系统的原点(0,0)为图片的左上角。坐标中的数字单位为像素点。
from PIL import Image import matplotlib.pyplot as plt img=Image.open('d:/ex.jpg') #打开图像 plt.figure("beauty") plt.subplot(1,2,1), plt.title('origin') plt.imshow(img),plt.axis('off') #box变量是一个四元组(左,上,右,下)。 box=(80,100,260,300) roi=img.crop(box) plt.subplot(1,2,2) plt.title('roi') plt.imshow(roi) plt.axis('off') plt.show()
用plot绘制显示出图片后,将鼠标移动到图片上,会在右下角出现当前点的坐标,以及像素值。
**几何变换 **
Image类有resize()、rotate()和transpose()方法进行几何变换。
图像的缩放和旋转
dst = img.resize((128, 128)) dst = img.rotate(45) # 顺时针角度表示
转换图像
dst = im.transpose(Image.FLIP_LEFT_RIGHT) #左右互换 dst = im.transpose(Image.FLIP_TOP_BOTTOM) #上下互换 dst = im.transpose(Image.ROTATE_90) #顺时针旋转 dst = im.transpose(Image.ROTATE_180) dst = im.transpose(Image.ROTATE_270)
transpose()和rotate()没有性能差别。
python图像处理库Image模块
创建一个新的图片
Image.new(mode, size) Image.new(mode, size, color)
层叠图片
层叠两个图片,img2和img2,alpha是一个介于[0,1]的浮点数,如果为0,效果为img1,如果为1.0,效果为img2。当然img1和img2的尺寸和模式必须相同。这个函数可以做出很漂亮的效果来,而图形的算术加减后边会说到。
Image.blend(img1, img2, alpha)
composite可以使用另外一个图片作为蒙板(mask),所有的这三张图片必须具备相同的尺寸,mask图片的模式可以为“1”,“L”,“RGBA”
Image.composite(img1, img2, mask)
添加水印
添加文字水印
from PIL import Image, ImageDraw,ImageFont im = Image.open("d:/pic/lena.jpg").convert('RGBA') txt=Image.new('RGBA', im.size, (0,0,0,0)) fnt=ImageFont.truetype("c:/Windows/fonts/Tahoma.ttf", 20) d=ImageDraw.Draw(txt) d.text((txt.size[0]-80,txt.size[1]-30), "cnBlogs",font=fnt, fill=(255,255,255,255)) out=Image.alpha_composite(im, txt) out.show()
添加小图片水印
from PIL import Image im = Image.open("d:/pic/lena.jpg") mark=Image.open("d:/logo_small.gif") layer=Image.new('RGBA', im.size, (0,0,0,0)) layer.paste(mark, (im.size[0]-150,im.size[1]-60)) out=Image.composite(layer,im,layer) out.show()
PIL Image 图像互转 numpy 数组
将 PIL Image 图片转换为 numpy 数组
im_array = np.array(im) # 也可以用 np.asarray(im) 区别是 np.array() 是深拷贝,np.asarray() 是浅拷贝
更多细节见python中的深拷贝与浅拷贝
numpy image 查看图片信息,可用如下的方法
print img.shape print img.dtype
将 numpy 数组转换为 PIL 图片
这里采用 matplotlib.image 读入图片数组,注意这里读入的数组是 float32 型的,范围是 0-1,而 PIL.Image 数据是 uinit8 型的,范围是0-255,所以要进行转换:
import matplotlib.image as mpimg from PIL import Image lena = mpimg.imread('lena.png') # 这里读入的数据是 float32 型的,范围是0-1 im = Image.fromarray(np.uinit8(lena*255)) im.show()
PIL image 查看图片信息,可用如下的方法
print type(img) print img.size #图片的尺寸 print img.mode #图片的模式 print img.format #图片的格式 print(img.getpixel((0,0))[0])#得到像素: #img读出来的图片获得某点像素用getpixel((w,h))可以直接返回这个点三个通道的像素值
图像中的像素访问
前面的一些例子中,我们都是利用Image.open()来打开一幅图像,然后直接对这个PIL对象进行操作。如果只是简单的操作还可以,但是如果操作稍微复杂一些,就比较吃力了。因此,通常我们加载完图片后,都是把图片转换成矩阵来进行更加复杂的操作。
打开图像并转化为矩阵,并显示
from PIL import Image import numpy as np import matplotlib.pyplot as plt img=np.array(Image.open('d:/lena.jpg')) #打开图像并转化为数字矩阵 plt.figure("dog") plt.imshow(img) plt.axis('off') plt.title('The image title') plt.show()
调用numpy中的array()函数就可以将PIL对象转换为数组对象。
查看图片信息,可用如下的方法
PIL image 查看图片信息,可用如下的方法
print type(img) print img.size #图片的尺寸 print img.mode #图片的模式 print img.format #图片的格式 print(img.getpixel((0,0))[0])#得到像素: #img读出来的图片获得某点像素用getpixel((w,h))可以直接返回这个点三个通道的像素值
numpy image 查看图片信息,可用如下的方法
print img.shape print img.dtype
如果是RGB图片,那么转换为array之后,就变成了一个rowscolschannels的三维矩阵,因此,我们可以使用
img[i,j,k]
来访问像素值。
例1:打开图片,并随机添加一些椒盐噪声
from PIL import Image import numpy as np import matplotlib.pyplot as plt img=np.array(Image.open('d:/ex.jpg')) #随机生成5000个椒盐 rows,cols,dims=img.shape for i in range(5000): x=np.random.randint(0,rows) y=np.random.randint(0,cols) img[x,y,:]=255 plt.figure("beauty") plt.imshow(img) plt.axis('off') plt.show()
例2:将lena图像二值化,像素值大于128的变为1,否则变为0
from PIL import Image import numpy as np import matplotlib.pyplot as plt img=np.array(Image.open('d:/pic/lena.jpg').convert('L')) rows,cols=img.shape for i in range(rows): for j in range(cols): if (img[i,j]<=128): img[i,j]=0 else: img[i,j]=1 plt.figure("lena") plt.imshow(img,cmap='gray') plt.axis('off') plt.show()
如果要对多个像素点进行操作,可以使用数组切片方式访问。切片方式返回的是以指定间隔下标访问 该数组的像素值。下面是有关灰度图像的一些例子:
img[i,:] = im[j,:] # 将第 j 行的数值赋值给第 i 行 img[:,i] = 100 # 将第 i 列的所有数值设为 100 img[:100,:50].sum() # 计算前 100 行、前 50 列所有数值的和 img[50:100,50:100] # 50~100 行,50~100 列(不包括第 100 行和第 100 列) img[i].mean() # 第 i 行所有数值的平均值 img[:,-1] # 最后一列 img[-2,:] (or im[-2]) # 倒数第二行
直接操作像素点
不但可以对每个像素点进行操作,而且,每一个通道都可以独立的进行操作。比如,将每个像素点的亮度(不知道有没有更专业的词)增大20%
out = img.point(lambda i : i * 1.2) #注意这里用到一个匿名函数(那个可以把i的1.2倍返回的函数)
argument * scale + offset e.g out = img.point(lambda i: i*1.2 + 10)
图像直方图
我们先来看两个函数reshape和flatten:
假设我们先生成一个一维数组:
vec=np.arange(15) print vec
如果我们要把这个一维数组,变成一个3*5二维矩阵,我们可以使用reshape来实现
mat= vec.reshape(3,5) print mat
现在如果我们返过来,知道一个二维矩阵,要变成一个一维数组,就不能用reshape了,只能用flatten. 我们来看两者的区别
a1=mat.reshape(1,-1) #-1表示为任意,让系统自动计算 print a1 a2=mat.flatten() print a2
可以看出,用reshape进行变换,实际上变换后还是二维数组,两个方括号,因此只能用flatten.
我们要对图像求直方图,就需要先把图像矩阵进行flatten操作,使之变为一维数组,然后再进行统计
画灰度图直方图
绘图都可以调用matplotlib.pyplot库来进行,其中的hist函数可以直接绘制直方图。
调用方式:
n, bins, patches = plt.hist(arr, bins=50, normed=1, facecolor='green', alpha=0.75)
hist的参数非常多,但常用的就这五个,只有第一个是必须的,后面四个可选
arr: 需要计算直方图的一维数组 bins: 直方图的柱数,可选项,默认为10 normed: 是否将得到的直方图向量归一化。默认为0 facecolor: 直方图颜色 alpha: 透明度
返回值 :
n: 直方图向量,是否归一化由参数设定 bins: 返回各个bin的区间范围 patches: 返回每个bin里面包含的数据,是一个list
from PIL import Image import numpy as np import matplotlib.pyplot as plt img=np.array(Image.open('d:/pic/lena.jpg').convert('L')) plt.figure("lena") arr=img.flatten() n, bins, patches = plt.hist(arr, bins=256, normed=1, facecolor='green', alpha=0.75) plt.title('The image title') plt.show()
彩色图片直方图
实际上是和灰度直方图一样的,只是分别画出三通道的直方图,然后叠加在一起。
from PIL import Image import numpy as np import matplotlib.pyplot as plt src=Image.open('d:/ex.jpg') r,g,b=src.split() plt.figure("lena") ar=np.array(r).flatten() plt.hist(ar, bins=256, normed=1,facecolor='r',edgecolor='r',hold=1) ag=np.array(g).flatten() plt.hist(ag, bins=256, normed=1, facecolor='g',edgecolor='g',hold=1) ab=np.array(b).flatten() plt.hist(ab, bins=256, normed=1, facecolor='b',edgecolor='b') plt.title('The image title') plt.show()
由此可见,matplotlib的画图功能是非常强大的,直方图只是其中非常小的一部分,更多的请参看官方文档:
http://matplotlib.org/api/pyplot_summary.html
Python如何读取指定文件夹下的所有图像
''' Load the image files form the folder input: imgDir: the direction of the folder imgName:the name of the folder output: data:the data of the dataset label:the label of the datset ''' def load_Img(imgDir,imgFoldName): imgs = os.listdir(imgDir+imgFoldName) imgNum = len(imgs) data = np.empty((imgNum,1,12,12),dtype="float32") label = np.empty((imgNum,),dtype="uint8") for i in range (imgNum): img = Image.open(imgDir+imgFoldName+"/"+imgs[i]) arr = np.asarray(img,dtype="float32") data[i,:,:,:] = arr label[i] = int(imgs[i].split('.')[0]) return data,label
调用方式
craterDir = "./data/CraterImg/Adjust/" foldName = "East_CraterAdjust12" data, label = load_Img(craterDir,foldName)
Python图形图像处理库ImageEnhance模块图像增强
可以使用ImageEnhance模块,其中包含了大量的预定义的图片加强方式
加强器包括,色彩平衡,亮度平衡,对比度,锐化度等。通过使用这些加强器,可以很轻松的做到图片的色彩调整,亮度调整,锐化等操作,google picasa中提供的一些基本的图片加强功能都可以实现。
颜色加强color用于调整图片的色彩平衡,相当于彩色电视机的色彩调整。这个类实现了上边提到的接口的enhance方法。
ImageEnhance.Color(img)#获得色彩加强器实例
然后即可使用enhance(factor)方法进行调整。
亮度加强brightness用于调整图片的明暗平衡。
ImageEnhance.Brightness(img)#获得亮度加强器实例
factor=1返回一个黑色的图片对象,0返回原始图片对象
对比度加强contrast用于调整图片的对比度,相当于彩色电视机的对比度调整。
ImageEnhance.Contrast(image) #获得对比度加强器实例
import ImageEnhance enh = ImageEnhance.Contrast(im) enh.ehhance(1.5).show("50% more contrast")
锐化度加强sharpness用于锐化/钝化图片。
ImageEnhance.Sharpness(image) #返回锐化加强器实例
应该注意的是锐化操作的factor是一个0-2的浮点数,当factor=0时,返回一个完全模糊的图片对象,当factor=1时,返回一个完全锐化的图片对象,factor=1时,返回原始图片对象
Python图像处理库ImageChops模块
这个模块主要包括对图片的算术运算,叫做通道运算(channel operations)。这个模块可以用于多种途径,包括一些特效制作,图片整合,算数绘图等等方面。
Invert:
ImageChops.invert(image)
图片反色,类似于集合操作中的求补集,最大值为Max,每个像素做减法,取出反色.
公式
out = MAX - image
lighter:
ImageChops.lighter(image1, image2)
darker:
ImageChops.darker(image1, image2)
difference
ImageChops.difference(image1, image2)
求出两张图片的绝对值,逐像素的做减法
multiply
ImageChops.multiply(image1, image2)
将两张图片互相叠加,如果用纯黑色与某图片进行叠加操作,会得到一个纯黑色的图片。如果用纯白色与图片作叠加,图片不受影响。
计算的公式如下公式
out = img1 * img2 / MAX
screen:
ImageChops.screen(image1, image2)
先反色,后叠加。
公式
out = MAX - ((MAX - image1) * (MAX - image2) / MAX)
add:
ImageChops.add(img1, img2, scale, offset)
对两张图片进行算术加法,按照一下公式进行计算
公式
out = (img1+img2) / scale + offset
如果尺度和偏移被忽略的化,scale=1.0, offset=0.0即
out = img1 + img2
subtract:
ImageChops.subtract(img1, img2, scale, offset)
对两张图片进行算术减法:
公式
out = (img1-img2) / scale + offset
Python图形图像处理库ImageFilter模块图像滤镜
ImageFilter是PIL的滤镜模块,通过这些预定义的滤镜,可以方便的对图片进行一些过滤操作,从而去掉图片中的噪音(部分的消除),这样可以降低将来处理的复杂度(如模式识别等)。
滤镜名称 含义 ImageFilter.BLUR 模糊滤镜 ImageFilter.CONTOUR 轮廓 ImageFilter.EDGE_ENHANCE 边界加强 ImageFilter.EDGE_ENHANCE_MORE 边界加强(阀值更大) ImageFilter.EMBOSS 浮雕滤镜 ImageFilter.FIND_EDGES 边界滤镜 ImageFilter.SMOOTH 平滑滤镜 ImageFilter.SMOOTH_MORE 平滑滤镜(阀值更大) ImageFilter.SHARPEN 锐化滤镜
要使用PIL的滤镜功能,需要引入ImageFilter模块
import Image, ImageFilter def inHalf(img): w,h = img.size return img.resize((w/2, h/2)) def filterDemo(): img = Image.open("sandstone_half.jpg") #img = inHalf(img) imgfilted = img.filter(ImageFilter.SHARPEN) #imgfilted.show() imgfilted.save("sandstone_sharpen.jpg") if __name__ == "__main__": filterDemo()
参考文献
用python简单处理图片
python图形处理库PIL(Python Image Library)