首页 > 编程笔记 > Python笔记 阅读:15

计算机视觉是指什么(新手必看)

计算机视觉是一门研究如何使机器“看”的科学,更进一步地说就是指用摄像机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步进行图形处理,使用计算机处理成为更适合人眼观察或传送给仪器检测的图像。

作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取“信息”的人工智能系统。这里的信息指的是由 Shannon 定义的,可以用来帮助做“决定”的信息。因为感知可以看作从感官信号中提取信息,所以计算机视觉也可以看作研究如何使人工系统从图像或多维数据中“感知”的科学。

计算机视觉就是用各种成像系统代替视觉器官作为输入敏感手段,并由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标是使计算机能像人那样通过视觉观察和理解世界,具有自主适应环境的能力。这是要经过长期的努力才能达到目标,因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能来完成一定的任务。

例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,还没有条件实现像人那样能识别和理解任何环境、完成自主导航的系统。因此,人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。

这里要指出的一点是,在计算机视觉系统中,计算机起代替人脑的作用,但这并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以根据计算机系统的特点来进行视觉信息的处理。但是,人类视觉系统是迄今为止人们所知道的功能最强大和完善的视觉系统。计算机视觉通过各种成像系统代替视觉器官作为输入敏感手段,并由计算机来代替大脑完成处理和解释。

计算机视觉的最终研究目标是使计算机能像人那样通过视觉观察和理解世界,具有自主适应环境的能力。这是需要经过长期的努力才能达到目标,因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能来完成一定的任务。例如,计算机视觉的一个重要应用领域是自主车辆的视觉导航,这还需要长期努力才能达到目标。因此,人们正在努力研究实现具有道路跟踪能力的视觉辅助驾驶系统,以避免与前方车辆的碰撞。

值得注意的是,虽然计算机在计算机视觉系统中起代替人脑的作用,但这并不意味着计算机必须按照人类视觉的方法来完成视觉信息的处理。计算机视觉可以根据计算机系统的特点进行有效的视觉信息处理。人类视觉系统是目前已知的功能最强大和完善的视觉系统,它在许多方面都具有重要的优势。但为了适应特定的环境和任务,我们还需要对计算机视觉技术进行进一步的优化和改进。

计算机视觉是一门综合性的学科,吸引了来自各个学科的研究者参与到对它的研究之中,其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学、神经生理学和认知科学等。

计算机视觉包括图像处理和模式识别,除此之外,还包括空间形状的描述、几何建模以及认识过程(认知科学与神经科学)。实现图像理解是计算机视觉的终极目标:
认知科学与神经科学(Cognitive Science and Neuroscience)将人类视觉作为主要的研究对象。计算机视觉中已有的许多方法与人类视觉极为相似。许多计算机视觉研究者对研究人类视觉计算模型比研究计算机视觉系统更感兴趣,他们希望计算机视觉更加自然化,更加接近生物视觉。

计算机视觉的研究与人类视觉的研究密切相关。为实现建立与人的视觉系统相类似的通用计算机视觉系统的目标,需要建立人类视觉的计算机理论。

计算机视觉的应用

人类正在进入信息时代,计算机也正越来越广泛地进入各个领域。一方面是更多未经计算机专业训练的人也需要应用计算机,另一方面是计算机的功能越来越强,使用方法越来越复杂。人可以通过视觉、听觉和语言与外界交换信息,并且可用不同的方式表示相同的含义,而计算机却要求严格按照各种程序语言来编写程序,只有这样计算机才能运行。这就使人与人交谈和通信时的灵活性与在使用计算机时所要求的严格和死板之间产生了尖锐的矛盾。

为使更多的人能使用复杂的计算机,必须改变过去那种让人来适应计算机、死记硬背计算机使用规则的情况,而是反过来让计算机来适应人的习惯和要求,以人所习惯的方式与人进行信息交换,也就是让计算机具有视觉、听觉和说话等能力。这时计算机必须具有逻辑推理和决策的能力。具有上述能力的计算机就是智能计算机。

智能计算机不但使计算机更便于为人们所使用,而且如果用这样的计算机来控制各种自动化装置(特别是智能机器人),就可以使这些自动化系统和智能机器人具有适应环境和自主做出决策的能力。这就可以在各种场合取代人的繁重工作,或代替人到各种危险和恶劣环境中完成任务。

计算机视觉和机器视觉领域有显著的重叠。计算机视觉涉及被用于许多领域的自动化图像分析的核心技术。机器视觉是人工智能的一个分支。简单来说,机器视觉就是用机器代替人眼来做测量和判断。在许多计算机视觉应用中,计算机被预编程,以解决特定的任务。

计算机视觉应用的实例包括:
其中,最突出的应用领域是医疗计算机视觉和医学图像处理。这个领域的特征信息从图像数据中提取,用于患者医疗诊断的目的。

通常,图像数据是形式显微镜图像、X射线图像、血管造影图像、超声图像和断层图像中的信息。比如,可以从这样的图像数据中提取肿瘤、动脉粥样硬化或其他恶性变化。它也可以是器官的尺寸、血流量等。这种应用领域还支持提供新的信息、医学研究的测量。计算机视觉在医疗领域的应用还包括增强超声图像或 X 射线图像,以降低噪声对图像的影响。

计算机视觉第二个应用领域是工业,这个领域中提取的信息用于制造过程。比如用于质量控制,自动检测最终产品的缺陷。

计算机视觉在军事领域的应用也非常广泛,最明显的例子就是探测敌方士兵、车辆和导弹制导。更先进的系统能够根据为导弹指导发送区域,而不是一个特定的目标,并在导弹到达基于本地获取的图像数据的区域目标时做出选择。现代军事概念,如“战场感知”,意味着各种传感器,包括图像传感器,提供了丰富的作战场景,可用于支持战略决策。在这种情况下,数据的自动处理可以减少复杂性和融合来自多个传感器的信息,以提高可靠性。

一个较新的应用领域是无人驾驶汽车和无人机。无人驾驶汽车或无人机通常使用计算机视觉进行导航,即它们知道自己在哪里,要去哪里,并能检测障碍物。

与相关学科的区别

计算机视觉、图像处理与图像分析、机器视觉是彼此紧密关联的学科,它们的基础理论大致相同。然而各研究机构、学术期刊、会议及公司往往会把自己归为其中某一个领域,于是各种各样的用来区分这些学科的特征便被提了出来。下面给出其中的一种区分方法。

计算机视觉的研究对象主要是映射到单幅或多幅图像上的三维场景,例如三维场景的重建。计算机视觉的研究很大程度上针对图像的内容。

图像处理与图像分析的研究对象主要是二维图像,可以实现图像的转换,尤其是针对像素级的操作,例如提高图像对比度、边缘提取、去噪声和几何变换(如图像旋转)。这一特征表明,无论是图像处理还是图像分析,研究内容都和图像的具体内容无关。

机器视觉主要是指工业领域的视觉研究,例如自主机器人的视觉,用于检测和测量的视觉。

模式识别使用各种方法从信号中提取信息,主要运用统计学的理论。此领域的一个主要方向便是从图像数据中提取信息。

相关文章