数字图像处理技术详解(新手必看)
数字图像处理技术,通俗地讲是指应用计算机以及数字设备对图像进行加工处理的技术。
一般情况下,由于图像处理的设备比较大,不易在室外使用,因此通常输入图像分两步进行:首先在室外通过摄影机、照相机、数码相机等设备将图像记录下来,然后在室内利用输入设备进行输入。
一般用磁带记录的是视频信号,通过 AN 口、1394 口输入视频采集卡;用胶片记录的是照片,可通过扫描仪扫描输入;电子照片可直接通过串口、并口或 USB 口输入。
为了有效解决大数据量与交换和传输时间之间的矛盾,通常除了采用大容量内存存储器进行并行传输和直接存储访问外,还需要利用外部磁盘、光盘和磁带等存储方式,以提高处理效率。这部分主要功能通常由硬件完成。
自 20 世纪 80 年代以来,计算机技术和超大规模集成电路技术的迅猛发展,极大地推动了通信技术(包括语言数据、图像)的飞速发展。因为图像通信具有形象直观、可靠、高效率等一系列优点,尤其是数字图像通信比模拟图像通信更具抗干扰性,便于进行压缩编码处理且易于加密,因此数字处理技术在图像通信工程中获得了广泛应用。
一般图像输出的方式可分为硬拷贝(如照相、打印、扫描等)和软拷贝(如CRT监视器及各种新型的平板监视器等)。
目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性,在图像处理中也有着广泛且有效的应用。
图像编码压缩技术可减少描述图像的数据量(比特数),以便节省图像传输和处理的时间,以及减少所占用的存储器容量。压缩可以在不失真的前提下获得,也可以在允许失真的条件下进行。编码是压缩技术中重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。
图像预处理阶段尤为重要,如果这个阶段处理不好,会直接导致后面的工作无法展开。图像增强是图像预处理阶段的重要步骤。
在采集图像时,由于光照的稳定性与均匀性等噪声的影响,灰尘对 CCD 摄影机镜头的影响,以及图像传输过程中由于硬件设备而获得的噪声,使得获取的图像不够理想,往往存在噪声、对比度不够、目标不清晰、有其他物体干扰等缺点。这就需要用图像增强技术来改善图像效果。
图像增强就是增强图像中用户感兴趣的信息,其主要目的有两个:
图像增强不是以图像保真原则为基点来处理图像的,而是根据图像质量变坏的一般情况提出一些改善方法。例如,在图像处理中,可以采用图像均衡的方法来缩小图像灰度差别,采用平滑滤波的方法去除图像存在的噪声,采用边缘增强的方法改善图像轮廓的不明显。
图像增强主要应用在图像特别暗时,或者因为曝光太亮而无法让目标突出时,这个时候就需要把目标的亮度提高一点,然后把不必要的障碍(俗称噪声)调暗,以利于目标清晰度最大化。
图像增强的方法通过一定手段对原图像附加一些信息或变换数据,有选择地突出图像中感兴趣的特征或者抑制(掩盖)图像中某些不需要的特征,使图像与视觉响应特性相匹配。
在图像增强过程中,不分析图像降质的原因,处理后的图像不一定逼近原始图像。
通过各种手段来获得清晰图像的方法就是图像增强。根据增强的信息不同,图像增强可以分为边缘增强、灰度增强、色彩饱和度增强等。其中,灰度增强又可以根据增强处理过程所在的空间不同,分为空间域增强和频率域增强两大类,分别简称空域法和频域法。
① 空域法主要是直接在空间域内对图像进行运算处理,分为点运算算法和邻域去噪算法(也称邻域增强算法)。
点运算通常包括灰度变换和直方图修正等,目的或使图像成像均匀,或扩大图像动态范围,扩展对比度。
邻域去噪算法分为图像平滑和锐化两种。平滑一般用于消除图像噪声,但是也容易引起图像边缘的模糊,常用算法有均值滤波、中值滤波。锐化的目的在于突出物体的边缘轮廓,便于目标识别,常用算法有梯度法、算子、高通滤波、掩码匹配法、统计差值法等。
② 频域法是利用图像变换方法将原来的图像空间中的图像以某种形式转换到其他空间中,然后利用该空间的特有性质进行图像处理,最后转换回原来的图像空间中,从而得到处理后的图像。
频域法增强技术的基础是卷积理论。其中,频域变换可以是傅里叶变换、小波变换、DCT 变换、Walsh 变换等。
我们可以用一幅图来表示图像增强所用的具体方法分类,如下图所示:
当然,作为初学者,我们不需要面面俱到、全部掌握,可以先选择掌握重点的几项。
虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究还在不断深入之中,是目前图像处理研究的热点之一。
一般图像的描述方法采用二维形状描述,可分为有边界描述和区域描述两类。对于特殊的纹理图像,可采用二维形状描述。随着图像处理研究的深入发展,已经开始进行三维物体描述的研究,提出了体积描述、表面描述、广义圆柱体描述等方法。
图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类。近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中越来越受重视。
目前图像重建成功的例子是 CT 技术(计算机断层扫描成像技术)、彩色超声波等。这是图像处理的另一个发展方向。
下面用一张表格来简明扼要地说明图像处理的常见应用,如下表所示。
数字图像处理的过程
数字图像处理通常包括如下几个过程:1) 图像信息的获取
为了在计算机上进行图像处理,必须把作为处理对象的模拟图像转换成数字图像信息。图像信息的获取一般包括图像的摄取、转换及数字化等几个步骤。这部分主要由处理系统硬件实现。一般情况下,由于图像处理的设备比较大,不易在室外使用,因此通常输入图像分两步进行:首先在室外通过摄影机、照相机、数码相机等设备将图像记录下来,然后在室内利用输入设备进行输入。
一般用磁带记录的是视频信号,通过 AN 口、1394 口输入视频采集卡;用胶片记录的是照片,可通过扫描仪扫描输入;电子照片可直接通过串口、并口或 USB 口输入。
2) 图像信息的存储与交换
由于数字图像中的信息量庞大,在处理过程中必须对数据进行存储和交换。为了有效解决大数据量与交换和传输时间之间的矛盾,通常除了采用大容量内存存储器进行并行传输和直接存储访问外,还需要利用外部磁盘、光盘和磁带等存储方式,以提高处理效率。这部分主要功能通常由硬件完成。
3) 具体的图像处理
数字图像处理是指将空间上离散的、在幅度上量化分层的数字图像经过特定的数学模式进行加工处理,以获得人眼视觉或某种接收系统所需的图像。自 20 世纪 80 年代以来,计算机技术和超大规模集成电路技术的迅猛发展,极大地推动了通信技术(包括语言数据、图像)的飞速发展。因为图像通信具有形象直观、可靠、高效率等一系列优点,尤其是数字图像通信比模拟图像通信更具抗干扰性,便于进行压缩编码处理且易于加密,因此数字处理技术在图像通信工程中获得了广泛应用。
4) 图像的输出和显示
数字图像处理的最终目的是提供便于人眼或接收系统解释和识别的图像,因此图像的输出和显示十分重要。一般图像输出的方式可分为硬拷贝(如照相、打印、扫描等)和软拷贝(如CRT监视器及各种新型的平板监视器等)。
数字图像处理常用的方法
数字图像处理常用的方法有图像变换、图像增强、图像分割、图像描述、图像分类(识别)和图像重建等。1) 图像变换
由于图像阵列很大,直接在空间域中进行处理涉及的计算量很大,因此往往采用各种图像变换的方法,如傅里叶变换、沃尔什变换、离散余弦变换等间接处理技术,将空间域的处理转换为变换域的处理。这样不仅可以减少计算量,而且能获得更有效的处理(如傅里叶变换可在频域中进行数字滤波处理)。目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性,在图像处理中也有着广泛且有效的应用。
图像编码压缩技术可减少描述图像的数据量(比特数),以便节省图像传输和处理的时间,以及减少所占用的存储器容量。压缩可以在不失真的前提下获得,也可以在允许失真的条件下进行。编码是压缩技术中重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。
2) 图像增强
对于一个数字图像处理系统来说,一般可以将处理流程分为 3 个阶段,首先是图像预处理阶段,其次是特征抽取阶段,最后是识别分析阶段。图像预处理阶段尤为重要,如果这个阶段处理不好,会直接导致后面的工作无法展开。图像增强是图像预处理阶段的重要步骤。
在采集图像时,由于光照的稳定性与均匀性等噪声的影响,灰尘对 CCD 摄影机镜头的影响,以及图像传输过程中由于硬件设备而获得的噪声,使得获取的图像不够理想,往往存在噪声、对比度不够、目标不清晰、有其他物体干扰等缺点。这就需要用图像增强技术来改善图像效果。
图像增强就是增强图像中用户感兴趣的信息,其主要目的有两个:
- 一是改善图像的视觉效果,提高图像成分的清晰度;
- 二是使图像变得更有利于计算机处理。
图像增强不是以图像保真原则为基点来处理图像的,而是根据图像质量变坏的一般情况提出一些改善方法。例如,在图像处理中,可以采用图像均衡的方法来缩小图像灰度差别,采用平滑滤波的方法去除图像存在的噪声,采用边缘增强的方法改善图像轮廓的不明显。
图像增强主要应用在图像特别暗时,或者因为曝光太亮而无法让目标突出时,这个时候就需要把目标的亮度提高一点,然后把不必要的障碍(俗称噪声)调暗,以利于目标清晰度最大化。
图像增强的方法通过一定手段对原图像附加一些信息或变换数据,有选择地突出图像中感兴趣的特征或者抑制(掩盖)图像中某些不需要的特征,使图像与视觉响应特性相匹配。
在图像增强过程中,不分析图像降质的原因,处理后的图像不一定逼近原始图像。
通过各种手段来获得清晰图像的方法就是图像增强。根据增强的信息不同,图像增强可以分为边缘增强、灰度增强、色彩饱和度增强等。其中,灰度增强又可以根据增强处理过程所在的空间不同,分为空间域增强和频率域增强两大类,分别简称空域法和频域法。
① 空域法主要是直接在空间域内对图像进行运算处理,分为点运算算法和邻域去噪算法(也称邻域增强算法)。
点运算通常包括灰度变换和直方图修正等,目的或使图像成像均匀,或扩大图像动态范围,扩展对比度。
邻域去噪算法分为图像平滑和锐化两种。平滑一般用于消除图像噪声,但是也容易引起图像边缘的模糊,常用算法有均值滤波、中值滤波。锐化的目的在于突出物体的边缘轮廓,便于目标识别,常用算法有梯度法、算子、高通滤波、掩码匹配法、统计差值法等。
② 频域法是利用图像变换方法将原来的图像空间中的图像以某种形式转换到其他空间中,然后利用该空间的特有性质进行图像处理,最后转换回原来的图像空间中,从而得到处理后的图像。
频域法增强技术的基础是卷积理论。其中,频域变换可以是傅里叶变换、小波变换、DCT 变换、Walsh 变换等。
我们可以用一幅图来表示图像增强所用的具体方法分类,如下图所示:

当然,作为初学者,我们不需要面面俱到、全部掌握,可以先选择掌握重点的几项。
3) 图像分割
图像分割是数字图像处理中的关键技术之一,它将图像中有意义的特征部分提取出来。有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究还在不断深入之中,是目前图像处理研究的热点之一。
4) 图像描述
图像描述是图像识别和理解的必要前提。作为简单的二值图像,可采用其几何特性描述物体的特性。一般图像的描述方法采用二维形状描述,可分为有边界描述和区域描述两类。对于特殊的纹理图像,可采用二维形状描述。随着图像处理研究的深入发展,已经开始进行三维物体描述的研究,提出了体积描述、表面描述、广义圆柱体描述等方法。
5) 图像分类(识别)
图像分类(识别)属于模式识别的范畴,其主要内容是对经过某些预处理(增强、复原、压缩)的图像进行分割和特征提取,从而进行判决分类。图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类。近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中越来越受重视。
6) 图像重建
图像重建是指对一些三维物体,应用 X 射线、超声波等物理方法取得物体内部结构数据,再将这些数据进行运算处理而构成物体内部某些部位的图像。目前图像重建成功的例子是 CT 技术(计算机断层扫描成像技术)、彩色超声波等。这是图像处理的另一个发展方向。
图像处理的应用
图像处理的应用十分广泛,大大促进了现代社会的发展。例如,日常生活中的人脸支付就用到了图像处理,出入停车场时的车牌识别也用到了图像处理。下面用一张表格来简明扼要地说明图像处理的常见应用,如下表所示。
领域 | 应用内容 |
---|---|
物理化学 | 结晶分析、谱分析 |
生物医学 | 细胞分析、染色体分类、血球分类、X 光、CT |
环境保护 | 水质及大气污染调查 |
地质 | 资源勘探、地图绘制 |
农林 | 植被分布调查、农作物估产 |
海洋 | 鱼群探察 |
水利 | 河流分布、水利及水害调查 |
气象 | 云图分析、灾害性检测等 |
通信 | 传真、电视、可视电话图像通信 |
工业 | 工业探伤、计算机视觉、自动控制、机器人 |
法律 | 公安指纹识别、人像鉴定 |
交通 | 铁路选定、交通指挥、汽车识别 |
军事 | 侦察、成像融合、成像制导 |
宇航 | 星际探险照片处理 |
文化 | 多媒体、动画特技 |
图像信号处理层次
图像信号的处理分为以下 3 个层次:- 图像处理:图像采集、存储,图像重建,图像变换、增强、恢复、校正,图像(视频)压缩编码。
- 图像分析:边缘检测,图像分割,目标表达、描述,目标颜色、形状、纹理、空间和运动分析,目标检测、识别。
- 图像理解:图像配准(Image registration)、融合,3-D 表示、建模、场景恢复,图像感知、解释、推理,基于内容的图像和视频检索。图像配准就是将不同时间、不同传感器(成像设备)或不同条件(天气、温度、摄像位置和角度等)下获取的两幅或多幅图像进行匹配、叠加的过程,它已经被广泛地应用于遥感数据分析、计算机视觉、图像处理等领域。