数字图像处理技术详解(非常全面)
信息是自然界物质运动的一个重要方面,人们认识和改造世界需要各种信息图像。这些信息是人类获取外界知识的主要来源,其中约 80% 的信息通过人眼获得。
在现代科学研究、生产活动等各个领域,越来越多地使用图像信息来认识和判断事物,以解决实际问题。获取图像信息固然重要,但我们的主要目的是对这些信息进行处理,以便从大量复杂的图像数据中提取出感兴趣的信息。
图像处理是指对图像信息进行加工和处理,以满足视觉或应用上的需求。因此,从某种意义上来说,对图像信息的处理比图像本身更为重要。
21 世纪是一个充满信息的时代,图像作为人类感知世界的视觉基础,是获取、表达和传递信息的重要手段。计算机时代所说的图像处理通常指的是数字图像处理,即利用计算机对图像进行处理。这一技术的发展历史并不悠久,数字图像处理技术的起源可以追溯到 20 世纪 20 年代,当时通过海底电缆对从英国伦敦传输到美国纽约的一幅照片采用了数字压缩技术。
数字图像处理技术首先帮助人们以更客观、准确的方式认识世界。人的视觉系统能够帮助人类获取超过3/4的信息,而图像和图形则是所有视觉信息的载体。尽管人眼的辨识能力很高,可以识别上千种颜色,但在很多情况下,图像对于人眼而言是模糊的,甚至是不可见的。通过图像增强技术,可以使这些模糊或不可见的图像变得清晰明亮。
在计算机视觉这一领域诞生的初期,一种普遍的研究范式是将图像看作二维的数字信号,然后借用数字信号处理中的方法进行处理,这就是数字图像处理(Digital Image Processing)。
随着该项技术的日趋成熟和逐步改进,根据电学模拟方法的基本特征和规律,可以将其细分为以下几种功能:
电学模拟处理方法具有较低的运行设备和成本投入,具有明显的优势,能够使计算机图像处理技术在较短的时间内完成图像的过滤处理。这种方法的应用前景广阔,具有很高的实用价值。
一般情况下,由于图像处理的设备比较大,不易在室外使用,因此通常输入图像分两步进行:首先在室外通过摄像机、照相机、数码相机等设备将图像记录下来,然后在室内利用输入设备进行输入。
一般用磁带记录的是视频信号,通过 AN 口、1394 口输入视频采集卡;用胶片记录的是照片,可通过扫描仪扫描输入;电子照片可直接通过串口、并口或 USB 口输入。
为了有效解决大数据量与交换和传输时间之间的矛盾,通常除了采用大容量内存存储器进行并行传输和直接存储访问外,还需要利用外部磁盘、光盘和磁带等存储方式,以提高处理效率。这部分主要功能通常由硬件完成。
自 20 世纪 80 年代以来,计算机技术和超大规模集成电路技术的迅猛发展,极大地推动了通信技术(包括语言数据、图像)的飞速发展。因为图像通信具有形象直观、可靠、高效率等一系列优点,尤其是数字图像通信比模拟图像通信更具抗干扰性,便于进行压缩编码处理且易于加密,因此数字处理技术在图像通信工程中获得了广泛应用。
图像编码压缩技术可减少描述图像的数据量(比特数),以便节省图像传输和处理的时间,以及减少所占用的存储器容量。压缩可以在不失真的前提下获得,也可以在允许失真的条件下进行。编码是压缩技术中重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。
图像预处理阶段尤为重要,如果这个阶段处理不好,会直接导致后面的工作无法展开。图像增强是图像预处理阶段的重要步骤。
在采集图像时,由于光照的稳定性与均匀性等噪声的影响,灰尘对 CCD 摄像机镜头的影响,以及图像传输过程中由于硬件设备而获得的噪声,使得获取的图像不够理想,往往存在噪声、对比度不够、目标不清晰、有其他物体干扰等缺点。这就需要用图像增强技术来改善图像效果。
图像增强就是增强图像中用户感兴趣的信息,其主要目的有两个:
图像增强不是以图像保真原则为基点来处理图像的,而是根据图像质量变坏的一般情况提出一些改善方法。例如,在图像处理中,可以采用图像均衡的方法来缩小图像灰度差别,采用平滑滤波的方法去除图像存在的噪声,采用边缘增强的方法改善图像轮廓的不明显。
图像增强主要应用在图像特别暗时,或者因为曝光太亮而无法让目标突出时,这个时候就需要把目标的亮度提高一点,然后把不必要的障碍(俗称噪声)调暗,以利于目标清晰度最大化。
图像增强的方法通过一定手段对原图像附加一些信息或变换数据,有选择地突出图像中感兴趣的特征或者抑制(掩盖)图像中某些不需要的特征,使图像与视觉响应特性相匹配。
在图像增强过程中,不分析图像降质的原因,处理后的图像不一定逼近原始图像。
通过各种手段来获得清晰图像的方法就是图像增强。根据增强的信息不同,图像增强可以分为边缘增强、灰度增强、色彩饱和度增强等。其中,灰度增强又可以根据增强处理过程所在的空间不同,分为空间域增强和频率域增强两大类,分别简称空域法和频域法。
空域法主要是直接在空间域内对图像进行运算处理,分为点运算算法和邻域去噪算法(也称邻域增强算法):
频域法是利用图像变换方法将原来的图像空间中的图像以某种形式转换到其他空间中,然后利用该空间的特有性质进行图像处理,最后转换回原来的图像空间中,从而得到处理后的图像。
频域法增强技术的基础是卷积理论。其中,频域变换可以是傅里叶变换、小波变换、DCT 变换、Walsh 变换等。
我们可以用一幅图来表示图像增强所用的具体方法分类,如下图所示:
作为初学者,我们也不需要面面俱到,可以先选择重点的几项掌握。
虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究还在不断深入之中,是目前图像处理研究的热点之一。
作为简单的二值图像,可采用其几何特性描述物体的特性。一般图像的描述方法采用二维形状描述,可分为有边界描述和区域描述两类。对于特殊的纹理图像,可采用二维形状描述。随着图像处理研究的深入发展,已经开始进行三维物体描述的研究,提出了体积描述、表面描述、广义圆柱体描述等方法。
图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类。近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中越来越受重视。
目前图像重建成功的例子是CT技术(计算机断层扫描成像技术)、彩色超声波等。这是图像处理的另一个发展方向。
下面用一张表来简要说明图像处理的常见应用:
在现代科学研究、生产活动等各个领域,越来越多地使用图像信息来认识和判断事物,以解决实际问题。获取图像信息固然重要,但我们的主要目的是对这些信息进行处理,以便从大量复杂的图像数据中提取出感兴趣的信息。
图像处理是指对图像信息进行加工和处理,以满足视觉或应用上的需求。因此,从某种意义上来说,对图像信息的处理比图像本身更为重要。
21 世纪是一个充满信息的时代,图像作为人类感知世界的视觉基础,是获取、表达和传递信息的重要手段。计算机时代所说的图像处理通常指的是数字图像处理,即利用计算机对图像进行处理。这一技术的发展历史并不悠久,数字图像处理技术的起源可以追溯到 20 世纪 20 年代,当时通过海底电缆对从英国伦敦传输到美国纽约的一幅照片采用了数字压缩技术。
数字图像处理技术首先帮助人们以更客观、准确的方式认识世界。人的视觉系统能够帮助人类获取超过3/4的信息,而图像和图形则是所有视觉信息的载体。尽管人眼的辨识能力很高,可以识别上千种颜色,但在很多情况下,图像对于人眼而言是模糊的,甚至是不可见的。通过图像增强技术,可以使这些模糊或不可见的图像变得清晰明亮。
在计算机视觉这一领域诞生的初期,一种普遍的研究范式是将图像看作二维的数字信号,然后借用数字信号处理中的方法进行处理,这就是数字图像处理(Digital Image Processing)。
图像处理的分类
图像处理通常可以分为 3 类:光学模拟处理、电学模拟处理和计算机数字处理。1) 光学模拟处理
光学模拟处理也称光信息处理,建立在傅里叶光学基础上,通过光学滤波、相关运算、频谱分析等,可以实现图像像质的改善、图像识别、图像的几何畸变和光度的校正、光信息的编码和存储、图像的伪彩色化、三维图像显示、对非光学信号进行光学处理等。2) 电学模拟处理
电学模拟处理把光强度信号转换成电信号,然后用电子学的方法对信号进行加、减、乘、除、浓度分割、反差放大、彩色合成、光谱对比等,在电视视频信号处理中经常应用。随着该项技术的日趋成熟和逐步改进,根据电学模拟方法的基本特征和规律,可以将其细分为以下几种功能:
- 通过建立反变化将信息数据进行重组,组成新的排列形式;
- 改变时钟脉冲的变化规律,并通过模拟的方式实现;
- 将各种响应不同的处理模式看作过滤器,完成信号的处理。
电学模拟处理方法具有较低的运行设备和成本投入,具有明显的优势,能够使计算机图像处理技术在较短的时间内完成图像的过滤处理。这种方法的应用前景广阔,具有很高的实用价值。
3) 计算机数字处理
图像的计算机数字处理是在以计算机为中心的、包括各种输入/输出及显示设备在内的数字图像处理系统上进行的。它将连续的模拟图像变换成离散的数字图像后,使用由特定的物理模型和数学模型编制而成的程序进行控制,并实现各种要求的处理。数字图像处理技术
数字图像处理技术,通俗地讲是指应用计算机以及数字设备对图像进行加工处理的技术。通常包括如下几个过程。1) 图像信息的获取
为了在计算机上进行图像处理,必须把作为处理对象的模拟图像转换成数字图像信息。图像信息的获取一般包括图像的摄取、转换及数字化等几个步骤。这部分主要由处理系统硬件实现。一般情况下,由于图像处理的设备比较大,不易在室外使用,因此通常输入图像分两步进行:首先在室外通过摄像机、照相机、数码相机等设备将图像记录下来,然后在室内利用输入设备进行输入。
一般用磁带记录的是视频信号,通过 AN 口、1394 口输入视频采集卡;用胶片记录的是照片,可通过扫描仪扫描输入;电子照片可直接通过串口、并口或 USB 口输入。
2) 图像信息的存储与交换
由于数字图像中的信息量庞大,在处理过程中必须对数据进行存储和交换。为了有效解决大数据量与交换和传输时间之间的矛盾,通常除了采用大容量内存存储器进行并行传输和直接存储访问外,还需要利用外部磁盘、光盘和磁带等存储方式,以提高处理效率。这部分主要功能通常由硬件完成。
3) 具体的图像处理
数字图像处理是指将空间上离散的、在幅度上量化分层的数字图像经过特定的数学模式进行加工处理,以获得人眼视觉或某种接收系统所需的图像。自 20 世纪 80 年代以来,计算机技术和超大规模集成电路技术的迅猛发展,极大地推动了通信技术(包括语言数据、图像)的飞速发展。因为图像通信具有形象直观、可靠、高效率等一系列优点,尤其是数字图像通信比模拟图像通信更具抗干扰性,便于进行压缩编码处理且易于加密,因此数字处理技术在图像通信工程中获得了广泛应用。
4) 图像的输出和显示
数字图像处理的最终目的是提供便于人眼或接收系统解释和识别的图像,因此图像的输出和显示十分重要。一般图像输出的方式可分为硬拷贝(如照相、打印、扫描等)和软拷贝(如 CRT 监视器及各种新型的平板监视器等)。数字图像处理常用方法
数字图像处理常用的方法有图像变换、图像增强、图像分割、图像描述、图像分类(识别)和图像重建等。1) 图像变换
由于图像阵列很大,直接在空间域中进行处理涉及的计算量很大,因此往往采用各种图像变换的方法,如傅里叶变换、沃尔什变换、离散余弦变换等间接处理技术,将空间域的处理转换为变换域的处理。这样不仅可以减少计算量,而且能获得更有效的处理(如傅里叶变换可在频域中进行数字滤波处理)。目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性,在图像处理中也有着广泛且有效的应用。图像编码压缩技术可减少描述图像的数据量(比特数),以便节省图像传输和处理的时间,以及减少所占用的存储器容量。压缩可以在不失真的前提下获得,也可以在允许失真的条件下进行。编码是压缩技术中重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。
2) 图像增强
对于一个数字图像处理系统来说,一般可以将处理流程分为 3 个阶段:首先是图像预处理阶段,其次是特征抽取阶段,最后是识别分析阶段。图像预处理阶段尤为重要,如果这个阶段处理不好,会直接导致后面的工作无法展开。图像增强是图像预处理阶段的重要步骤。
在采集图像时,由于光照的稳定性与均匀性等噪声的影响,灰尘对 CCD 摄像机镜头的影响,以及图像传输过程中由于硬件设备而获得的噪声,使得获取的图像不够理想,往往存在噪声、对比度不够、目标不清晰、有其他物体干扰等缺点。这就需要用图像增强技术来改善图像效果。
图像增强就是增强图像中用户感兴趣的信息,其主要目的有两个:
- 一是改善图像的视觉效果,提高图像成分的清晰度;
- 二是使图像变得更有利于计算机处理。
图像增强不是以图像保真原则为基点来处理图像的,而是根据图像质量变坏的一般情况提出一些改善方法。例如,在图像处理中,可以采用图像均衡的方法来缩小图像灰度差别,采用平滑滤波的方法去除图像存在的噪声,采用边缘增强的方法改善图像轮廓的不明显。
图像增强主要应用在图像特别暗时,或者因为曝光太亮而无法让目标突出时,这个时候就需要把目标的亮度提高一点,然后把不必要的障碍(俗称噪声)调暗,以利于目标清晰度最大化。
图像增强的方法通过一定手段对原图像附加一些信息或变换数据,有选择地突出图像中感兴趣的特征或者抑制(掩盖)图像中某些不需要的特征,使图像与视觉响应特性相匹配。
在图像增强过程中,不分析图像降质的原因,处理后的图像不一定逼近原始图像。
通过各种手段来获得清晰图像的方法就是图像增强。根据增强的信息不同,图像增强可以分为边缘增强、灰度增强、色彩饱和度增强等。其中,灰度增强又可以根据增强处理过程所在的空间不同,分为空间域增强和频率域增强两大类,分别简称空域法和频域法。
空域法主要是直接在空间域内对图像进行运算处理,分为点运算算法和邻域去噪算法(也称邻域增强算法):
- 点运算通常包括灰度变换和直方图修正等,目的或使图像成像均匀,或扩大图像动态范围,扩展对比度。
- 邻域去噪算法分为图像平滑和锐化两种。平滑一般用于消除图像噪声,但是也容易引起图像边缘的模糊,常用算法有均值滤波、中值滤波。锐化的目的在于突出物体的边缘轮廓,便于目标识别,常用算法有梯度法、算子、高通滤波、掩码匹配法、统计差值法等。
频域法是利用图像变换方法将原来的图像空间中的图像以某种形式转换到其他空间中,然后利用该空间的特有性质进行图像处理,最后转换回原来的图像空间中,从而得到处理后的图像。
频域法增强技术的基础是卷积理论。其中,频域变换可以是傅里叶变换、小波变换、DCT 变换、Walsh 变换等。
我们可以用一幅图来表示图像增强所用的具体方法分类,如下图所示:

作为初学者,我们也不需要面面俱到,可以先选择重点的几项掌握。
3) 图像分割
图像分割是数字图像处理中的关键技术之一,它将图像中有意义的特征部分提取出来。有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究还在不断深入之中,是目前图像处理研究的热点之一。
4) 图像描述
图像描述是图像识别和理解的必要前提。作为简单的二值图像,可采用其几何特性描述物体的特性。一般图像的描述方法采用二维形状描述,可分为有边界描述和区域描述两类。对于特殊的纹理图像,可采用二维形状描述。随着图像处理研究的深入发展,已经开始进行三维物体描述的研究,提出了体积描述、表面描述、广义圆柱体描述等方法。
5) 图像分类(识别)
图像分类(识别)属于模式识别的范畴,其主要内容是对经过某些预处理(增强、复原、压缩)的图像进行分割和特征提取,从而进行判决分类。图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类。近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中越来越受重视。
6) 图像重建
图像重建是指对一些三维物体,应用 X 射线、超声波等物理方法取得物体内部结构数据,再将这些数据进行运算处理而构成物体内部某些部位的图像。目前图像重建成功的例子是CT技术(计算机断层扫描成像技术)、彩色超声波等。这是图像处理的另一个发展方向。
图像处理的应用
图像处理的应用十分广泛,大大促进了现代社会的发展,比如人脸支付、指纹支付就用到图像处理,停车场识别车牌也用到图像处理。下面用一张表来简要说明图像处理的常见应用:
领 域 | 应用内容 |
---|---|
物理化学 | 结晶分析、谱分析 |
生物医学 | 细胞分析、染色体分类、血球分类、X光、CT |
环境保护 | 水质及大气污染调查 |
地质 | 资源勘探、地图绘制 |
农林 | 植被分布调查、农作物估产 |
海洋 | 鱼群探查 |
水利 | 河流分布、水利及水害调查 |
气象 | 云图分析、灾害性检测等 |
通信 | 传真、电视、可视电话图像通信 |
工业 | 工业探伤、计算机视觉、自动控制、机器人 |
法律 | 公安指纹识别、人像鉴定 |
交通 | 铁路选定、交通指挥、汽车识别 |
军事 | 侦察、成像融合、成像制导 |
宇航 | 星际探险照片处理 |
文化 | 多媒体、动画特技 |