时间复杂度和空间复杂度的概念(非常详细)
上节《算法是什么》中提到,解决一个问题的算法可能有多种,这种情况下,我们就必须对这些算法进行取舍,从中挑选出一个“最好”的。
算法本身是不分好坏的,所谓最好的算法,指的是最适合当前场景的算法。挑选算法时,主要考虑以下两方面因素:
当问题对应的算法数量较少时(比如 2、3 种),我们可以编写出各个算法对应的程序,逐个在机器上运行,记录它们各自的执行时间和占用内存空间的大小,最终挑选出最好的算法。如果问题对应的算法数量有很多(比如 10 种,20 种),先前的挑选方式将不再适用,因为将各个算法一一编写成程序的工作量是巨大的,得不偿失。
实际开发中,我们往往采用“预先估值”的方法挑选算法。具体来讲,就是分析各个算法的实现过程(步骤),估算出它们各自的运行时间和占用的内存空间,进而挑选出最好的算法。用“预先估算”方式挑选算法时,我们习惯用时间复杂度表示一个算法的运行时间,用空间复杂度表示算法占用存储空间的大小。
接下来,我们就来了解一下如何估算一个算法的时间复杂度和空间复杂度。
接下来,我们以《算法是什么》一节中求 n! 的算法为例:
2*n+4 可以直接作为算法执行时间的估值,也可以对它进行简化,用规范的形式表示算法的运行时间。
首先,我们可以尝试对每个表达式进行简化,简化方法是:假设表达式中变量的值无限大时,去除掉那些对表达式结果影响较小的项。以 3*n2+4*n+5 为例,简化过程为:
简化表达式的过程可以总结为:
基于“n 值无限大”的思想,3*n2+4*n+5 最终可以简化为 n2。无论多么复杂的表达式,都可以采用这种方式进行简化。
采用大 O 记法表示算法的执行时间,直接套用如下的格式即可:
采用大 O 记法,2*n+4 可以用 O(n) 表示,3*n2+4*n+5 可以用
如果一个算法的执行时间最终估算为
比较多个算法占用的内存大小,本质上比较的是各个算法执行过程中额外申请的内存空间的大小。举个简单的例子:
与时间复杂度的表示方法一样,空间复杂度也采用大 O 记法表示。算法空间复杂度的估算方法是:
不过现在硬件便宜了,可以为计算机增加大量存储空间,所以程序员往往更加注重时间复杂度。至于空间复杂度,只要处于一个合理的范围即可。
算法本身是不分好坏的,所谓最好的算法,指的是最适合当前场景的算法。挑选算法时,主要考虑以下两方面因素:
- 执行效率:根据算法所编写的程序,执行时间越短,执行效率就越高;
- 占用的内存空间:不同算法编写出的程序,运行时占用的内存空间也不相同。如果实际场景中仅能使用少量的内存空间,就应该优先选择占用空间最少的算法。
当问题对应的算法数量较少时(比如 2、3 种),我们可以编写出各个算法对应的程序,逐个在机器上运行,记录它们各自的执行时间和占用内存空间的大小,最终挑选出最好的算法。如果问题对应的算法数量有很多(比如 10 种,20 种),先前的挑选方式将不再适用,因为将各个算法一一编写成程序的工作量是巨大的,得不偿失。
实际开发中,我们往往采用“预先估值”的方法挑选算法。具体来讲,就是分析各个算法的实现过程(步骤),估算出它们各自的运行时间和占用的内存空间,进而挑选出最好的算法。用“预先估算”方式挑选算法时,我们习惯用时间复杂度表示一个算法的运行时间,用空间复杂度表示算法占用存储空间的大小。
接下来,我们就来了解一下如何估算一个算法的时间复杂度和空间复杂度。
时间复杂度
时间复杂度用于表示算法的执行时间。接下来,我们以《算法是什么》一节中求 n! 的算法为例:
输入 n // 接收 n 的值 p <- 1 // p 的初值置为 1 for i<-1 to n: // i 的值从 1 一直到 n p <- p * i // 将 p*i 的值赋值给 p Print p // 输出 p 的值计算它的时间复杂度,只需经历以下几个步骤:
1) 统计算法中各个步骤的执行次数
整个算法中共有 5 行伪指令,它们各自的执行次数分别是:输入 n <- 执行 1 次 p <- 1 <- 执行 1 次 for i<-1 to n: <- i 的值从 1 遍历到 n,当 i 的值为 n+1 的时候退出循环,总共执行 n+1 次 p <- p * i <- i 从 1 到 n 的过程,共执行 n 次 Print p <- 执行 1 次统计算法中所有伪指令执行的总次数,结果为 2*n+4。显然,2*n+4 不是一个固定值,整个表达式值的大小取决于 n 的值。
2*n+4 可以直接作为算法执行时间的估值,也可以对它进行简化,用规范的形式表示算法的运行时间。
2) 简化算法的执行次数
通过统计各个算法中每条伪指令的执行次数,每个算法的运行时间都可以用类似 2*n+4、3*n2+4*n+5 这样的表达式表示。这就产生一个问题,如何比较各个表达式的大小呢?首先,我们可以尝试对每个表达式进行简化,简化方法是:假设表达式中变量的值无限大时,去除掉那些对表达式结果影响较小的项。以 3*n2+4*n+5 为例,简化过程为:
- 当 n 无限大时,3*n2+4*n 与 3*n2+4*n+5 的值非常接近,是否加 5 对表达式的值影响不大,因此表达式可以简化为 3*n2+4*n;
- 当 n 无限大时,3*n2 的值要远远大于 4*n 的值,它们之间类似于 10000 和 1 之间的关系,因此是否加 4*n 对表达式最终的值影响不大,整个表达式可以简化为 3*n2;
- 当 n 无限大时,n2 的值已经超级大,是否乘 3 对最终结果影响不大,整个表达式可以简化为 n2。
简化表达式的过程可以总结为:
- 去掉表达式中所有的加法常数项,3*n2+4*n+5 中的 5 就是加法常数项;
- 只保留表达式中变量指数最大的项,3*n2+4*n 中 n 的最大指数为 2,所以只保留 3*n2;
- 去掉常数系数,3*n2 中的 3 就是 n2 的常数系数。
基于“n 值无限大”的思想,3*n2+4*n+5 最终可以简化为 n2。无论多么复杂的表达式,都可以采用这种方式进行简化。
3) 大O记法表示时间复杂度
除了用 n 外,一些人还可能会用 a、b、c 等字符作为表达式中的变量。为此,人们逐渐达成了一种共识,即都用 n 作为表达式中的变量,并采用大 O 记法表示算法的执行时间。采用大 O 记法表示算法的执行时间,直接套用如下的格式即可:
O(频度)
频度指的就是简化后的表达式。采用大 O 记法,2*n+4 可以用 O(n) 表示,3*n2+4*n+5 可以用
O(n2)
表示。注意,如果一个算法对应的表达式中没有变量(比如 10,100 等),则用O(1)
表示算法的执行时间。如果一个算法的执行时间最终估算为
O(n)
,那么该算法的时间复杂度就是O(n)
。如下列举了常用的几种时间复杂度以及它们之间的大小关系:
O(1)< O(logn) < O(n) < O(n2) < O(n3) < O(2n)
O(1)
是最小的,对应的算法的执行时间最短,执行效率最高。空间复杂度
空间复杂度衡量的是算法执行过程占用的内存空间的大小。比较多个算法占用的内存大小,本质上比较的是各个算法执行过程中额外申请的内存空间的大小。举个简单的例子:
输入 n A[i...n] = {1...n} <- 额外申请 n 个空间根据 n 的值,算法执行时需要申请 n 个整数的内存空间,n 的值越大,额外申请的内存空间就越多。
与时间复杂度的表示方法一样,空间复杂度也采用大 O 记法表示。算法空间复杂度的估算方法是:
- 如果算法中额外申请的内存空间不受用户输入值的影响(是一个固定值),那么该算法的空间复杂度用 O(1) 表示;
- 如果随着输入值 n 的增大,算法申请的存储空间成线性增长,则程序的空间复杂度用 O(n) 表示;
- 如果随着输入值 n 的增大,程序申请的存储空间成 n2 关系增长,则程序的空间复杂度用 O(n2) 表示;
- 如果随着输入值 n 的增大,程序申请的存储空间成 n3 关系增长,则程序的空间复杂度用 O(n3) 表示;
总结
时间复杂度和空间复杂度是衡量算法好坏的两个关键指标,但是在不同的开发场景中,它们的重要程度可能不同,比如:- 在处理大规模数据时,时间复杂度可能更为重要,因为快速处理数据可以在第一时间拿到结果。
- 在内存受限的环境中,空间复杂度可能更为关键,因为需要确保算法在有限的内存内运行。
不过现在硬件便宜了,可以为计算机增加大量存储空间,所以程序员往往更加注重时间复杂度。至于空间复杂度,只要处于一个合理的范围即可。