数据结构与算法学习笔记之如何分析一个排序算法？

时间：2018-10-19 16:35:38 阅读：287 评论：0 收藏：0 [点我收藏+]

前言

现在IT这块找工作，不会几个算法都不好意思出门，排序算法恰巧是其中最简单的，我接触的第一个算法就是它，但是你知道怎么分析一个排序算法么？有很多时间复杂度相同的排序算法，在实际编码中，那又如何选择呢？下面我们带着问题一起学习一下。

正文

一、常见经典的排序方法

（图片来自于一像素）

插入排序

希尔排序（递减增量排序算法）

归并排序

快速排序

技术分享图片

冒泡排序

技术分享图片

选择排序

技术分享图片

计数排序

堆排序

技术分享图片

二、按照时间复杂度归类

时间复杂度O（n²）：

冒泡排序、插入排序、选择排序

时间复杂度O(nlogn)：
快速排序、归并排序

时间复杂度O(n)：

计数排序、基数排序、桶排序

三、如何分析一个“排序算法”？

从三个方面入手

a、算法的执行效率

1.最好、最坏、平均情况时间复杂度。

从算法的核心，复杂度入手，给出最好最坏，平均情况下的时间复杂度，便于分析

2. 时间复杂度的系数、常数和低阶。

时间复杂度表示的是规模很大的一种增涨趋势，很容易就忽略系数，低阶，常数等，实际开发中排序的规模都是像10.100.1000这种小规模

3. 比较次数，交换（或移动）次数。

排序算法执行过程中，涉及两种操作，一种是元素比较大小，一种是元素交换或移动位置，所以比较次数，交换次数都得考虑进去。

b、排序算法的内存消耗

算法消耗可以通过空间复杂度来衡量

原地排序算法：特指空间复杂度是O(1)的排序算法。

c、排序算法的稳定性

1. 稳定性概念：如果待排序的序列中存在值相等的元素，经过排序之后，相等元素之间原有的先后顺序不变。
2. 稳定性重要性：可针对对象的多种属性进行有优先级的排序。
3. 举例：给电商交易系统中的“订单”排序，按照金额大小对订单数据排序，对于相同金额的订单以下单时间早晚排序。用稳定排序算法可简洁地解决。先按照下单时间给订单排序，排序完成后用稳定排序算法按照订单金额重新排序。

四、详解冒泡排序

冒泡排序只会操作相邻的两个数据。每次冒泡操作都会对相邻的两个元素进行比较，看是否满足大小关系要求，如果不满足就让它俩互换。

冒泡排序只涉及相邻数据的交换，只需要常量级的临时空间，所以它的空间复杂度未O（1）是原地排序算法

稳定性：当有相邻的两个元素大小相等时，不做交换，冒泡排序是稳定的排序算法。

引入两个概念：

默认从小到大未有序

有序度：数组中具有有序关系的元素对的个数。

满有序度：完全有序的数组

逆序度：数组中具有无序关系的元素对的个数。

逆序度=满有序度-有序度

排序的过程实际上就是增加有序度，减少逆序度的过程

时间复杂度：
1. 最好情况（满有序度）：O(n)。
2. 最坏情况（满逆序度）：O(n^2)。
3. 平均情况：
“有序度”和“逆序度”：对于一个不完全有序的数组，如4，5，6，3，2，1，有序元素对为3个（4，5），（4，6），（5，6），有序度为3，逆序度为12；对于一个完全有序的数组，如1，2，3，4，5，6，有序度就是n*(n-1)/2，也就是15，称作满有序度；逆序度=满有序度-有序度；冒泡排序、插入排序交换（或移动）次数=逆序度。
最好情况下初始有序度为n*(n-1)/2，最坏情况下初始有序度为0，则平均初始有序度为n*(n-1)/4，即交换次数为n*(n-1)/4，因交换次数<比较次数<最坏情况时间复杂度，所以平均时间复杂度为O(n²)。

代码实现：

// 冒泡排序，a 表示数组，n 表示数组大小
public void bubbleSort(int[] a, int n) {
  if (n <= 1) return;
 
 for (int i = 0; i < n; ++i) {
    // 提前退出冒泡循环的标志位
    boolean flag = false;
    for (int j = 0; j < n - i - 1; ++j) {
      if (a[j] > a[j+1]) { // 交换
        int tmp = a[j];
        a[j] = a[j+1];
        a[j+1] = tmp;
        flag = true;  // 表示有数据交换      
      }
    }
    if (!flag) break;  // 没有数据交换，提前退出
  }
}

五、详解插入排序

将数据分为两个区间，已排序区间和未排序区间，初始已排序区间只有一个元素(即第一个数据)，我们取未排序区间的元素，在已排序的区间中找到合适的位置插入位置插入，并保证已排序区间数据一直有序，重复过程，直到未排序区间中没有元素

运行过程中看得出来，不需要额外的存储空间，所以空间复杂度为0（1），也是原地排序算法

同样值的元素，前后顺序保持不变，是稳定的排序算法

时间复杂度：

最好时间复杂度为O(n)

最坏时间复杂度为O(n²)

平均时间复杂度为O(n²)

代码实现：

// 插入排序，a 表示数组，n 表示数组大小
public void insertionSort(int[] a, int n) {
  if (n <= 1) return;

  for (int i = 1; i < n; ++i) {
    int value = a[i];
    int j = i - 1;
    // 查找插入的位置
    for (; j >= 0; --j) {
      if (a[j] > value) {
        a[j+1] = a[j];  // 数据移动
      } else {
        break;
      }
    }
    a[j+1] = value; // 插入数据
  }
}