一、通俗解释
1 什么是图像处理?
图像是生活中,人们体验最丰富的部分,数字图像处理即利用计算机来处理图像,PS软件,手机拍照美颜,人脸识别等等,都需要用到数字图像处理的知识来解决。
自然界的图像是模拟形式的,计算机无法直接处理,需要将其进行数字化处理之后,再传给计算机来处理。
2 图像处理为什么重要?
人的大脑皮层, 有差不多 70% 都是在处理视觉信息。是人类获取信息最主要的渠道,没有之一!
在网络世界,照片和视频(图像的集合)正呈爆炸式增长!
下图是网络上新增数据的占比趋势图。灰色是结构化数据,蓝色是非结构化数据(大部分都是图像和视频)。
可以很明显的发现,图片和视频正在以指数级的速度增长。
二、图片在计算机中的表示
而在计算机视觉CV出现之前,图像对于计算机来说是黑盒的状态。
一张图片对于机器只是一个文件。
机器并不知道图片里的内容到底是什么,只知道这张图片什么尺寸,多少MB,什么格式。
对计算机而言,只能识别数字,因此,平时我们所见到的图像,在计算机中都是一组数字。
例如:
当通过相机捕获现实世界的景物时,相机会捕获现实世界的光源信号,并转化为数字信号保存到存储器上,显示时,计算机将数字信号转成发光器材的模拟信号,再绘制到屏幕上,呈现出来!
1灰度图像
灰度图像(亦称单色图像),每个像素的亮度用一个整数来表示,通常数值范围在0到255之间,0表示纯黑、255表示纯白,而其它表示灰色。如下图所示:
计算机到底是怎样表达一张灰度图呢?被转化成数字存储到计算机当中后的数据是这样的:
上面的每个值分别对应着图像的各个点,用于描述图像每个点上的颜色信息,当我们要显示这些数据时,计算机会把这组数据写入到显存里,由GPU根据显存数据将其显示到屏幕上。
2 彩色图像
牛顿曾利用三棱镜,将一束白光分解成不同的颜色。
图像的颜色也是可以由其它的颜色混合而成的,最常见的颜色模型是RGB模型,由三原色红、绿、蓝组成了其它任意颜色,
这个,通常称之为加法混色模型,电脑、电视机这样的显示设备多是采用这种颜色模型的。
彩色图像可用“红、绿、蓝”三元组(三基色)的二维矩阵来表示。通常,三元组的每个数值也是在0到255之间,0表示相应的基色在该像素中没有,而255则代表相应的基色在该像素中取得最大值。彩色图像在计算机中的表示如下:
彩图有三个矩阵表示三种颜色,一般我们称之为图像的三个通道,这三个通道的组合实现了彩色图片的展示,每个通道效果如下所示:
编程时,偶尔会见到四元组“rgba(12,22,33, 0.8)表示,最后一个是透明度指标,不要被四通道给整懵了!
3 二值图像
也称之为单色图像, 图像每个像素点仅占一位,其值只有0或1。
0 代表黑 1代表白或相反。
因为图像中的每个像素仅需1比特位信息,常把单色图像称为是1位图像。(而灰度图每个像素需要8比特位存储,用以区分0-255)
二值图像比较简单,一般由黑色区域和白色区域组成。有时候也用0和255表示二值图像,若存储格式固定不考虑空间浪费的情况下。
下图为彩色图、灰度图、二值图的对比效果:
三、图像处理方法(奇妙的滤镜)
图像处理是利用计算机技术将图像信号转换为数字信号,进而进行处理的过程。下面通过常用的滤镜操作,简单的描述一下图像处理的过程。
1 灰度滤镜
将彩色图像转换为灰度图是图像处理的最基本预处理操作,将原来的RGB(R,G,B)中的R,G,B统一用Gray替换,形成新的颜色RGB(Gray,Gray,Gray),用它替换原来的RGB(R,G,B)就是灰度图了。改变象素矩阵的RGB值,来达到彩色图转变为灰度图。
2 黑白滤镜
顾名思义,就是图片的颜色只有黑色和白色,将灰度图像转换为二值图的过程,常通过依次遍历判断实现,比如可以设置规则,像素>=127则置为255,否则置为0。
3 反向滤镜
就是RGB三种颜色分别取255的差值。
4 去色滤镜
RGB三种颜色取三种颜色的最值(最大、最小)的平均值。
5 高斯模糊滤镜
高斯模糊的原理就是根据正态分布使得每个像素点周围的像素点的权重不一致,将各个权重(各个权重值和为1)与对应的色值相乘,所得结果求和为中心像素点新的色值。
6 怀旧滤镜
对RGB三种颜色对应的数值矩阵做如下变换:
得到的怀旧风格图片如下:
7 边缘检测
目的是找到图像中亮度变化剧烈的像素点构成的集合,表现出来就是轮廓。如图:
四、图像处理的典型问题
几何变换(geometric transformations):包括放大、缩小、旋转等。
颜色处理(color):颜色空间的转化、亮度以及对比度的调节、颜色修正等。
图像融合(image composite):多个图像的加、减、组合、拼接。
降噪(image denoising):研究各种针对二维图像的去噪滤波器或者信号处理技术。
边缘检测:进行边缘或者其他局部特征提取。
分割:依据不同标准,把二维图像分割成不同区域。
图像编辑:和计算机图形学有一定交叉。
图像配准:比较或集成不同条件下获取的图像。
图像增强(image enhancement):
图像数字水印:研究图像域的数据隐藏、加密、或认证。
图像压缩:研究图像压缩。
五、总结
图像是人类获取和交换信息的主要媒介,因此,图像处理的应用领域必然涉及到人类生活的方方面面。
伴随计算机技术和半导体工业的发展,数字图像处理技术的应用也是越来越广泛,随处可见,其应用覆盖航天、航空、军事、公安、生物医学、工业工程、通信、电子商务、文化艺术中。
随着人工智能AI技术的发展,计算机对图片的处理变得更加智能,深度学习在计算机视觉中有比较成功的应用,包括人脸识别、图像问答、物体检测、物体跟踪、动态印刷等等。
其显著地提高了计算机,理解和处理图片的能力。
与人工智能AI技术的融合,将帮助人们解决越来越多的实际问题,让人类可以更加专注于更重要的事情。