Skip to content

Latest commit

 

History

History
216 lines (148 loc) · 6.92 KB

stl-sort.md

File metadata and controls

216 lines (148 loc) · 6.92 KB

本页所列函数默认定义于头文件 <algorithm> 中。

qsort

参见:qsortstd::qsort

该函数为 C 标准库实现的 快速排序,定义在 <stdlib.h> 中。在 C++ 标准库里,该函数定义在 <cstdlib> 中。

qsort 与 bsearch 的比较函数

qsort 函数有四个参数:数组名元素个数元素大小比较规则。其中,比较规则通过指定比较函数来实现,指定不同的比较函数可以实现不同的排序规则。

比较函数的参数限定为两个 const void 类型的指针。返回值规定为正数、负数和 0。

比较函数的一种示例写法为:

int compare(const void *p1, const void *p2)  // int 类型数组的比较函数
{
    int *a = (int *)p1;
    int *b = (int *)p2;
    if (*a > *b)
        return 1;  // 返回正数表示 a 大于 b
    else if (*a < *b)
        return -1;  // 返回负数表示 a 小于 b
    else
        return 0;  // 返回 0 表示 a 与 b 等价
}

等价不代表相等,只代表在此比较规则下两元素等价。

注意:返回值用两个元素相减代替正负数是一种典型的错误写法,因为这样可能会导致溢出错误。

std::sort

参见:std::sort

用法:

// a[0] .. a[n - 1] 为需要排序的数列
// 对 a 原地排序,将其按从小到大的顺序排列
std::sort(a, a + n);

// cmp 为自定义的比较函数
std::sort(a, a + n, cmp);

注意:sort 的比较函数的返回值是 truefalse,用 truefalse 表示两个元素的大小(先后)关系,这与 qsort 的三值比较函数的语义完全不同。

std::nth_element

参见:std::nth_element

用法:

std::nth_element(first, nth, last);
std::nth_element(first, nth, last, cmp);

它重排 [first, last) 中的元素,使得 nth 所指向的元素被更改为 [first, last) 排好序后该位置会出现的元素。这个新的 nth 元素前的所有元素小于或等于新的 nth 元素后的所有元素。

实现算法是未完成的内省排序。

对于以上两种用法,C++ 标准要求它的平均时间复杂度为 $O(n)$,其中 n 为 std::distance(first, last)

它常用于构建 K-D Tree

std::stable_sort

参见:std::stable_sort

用法:

std::stable_sort(first, last);
std::stable_sort(first, last, cmp);

稳定排序,保证相等元素排序后的相对位置与原序列相同。

时间复杂度为 $O(n\log (n)^2)$,当额外内存可用时,复杂度为 $O(n\log n)$

std::partial_sort

参见:std::partial_sort

用法:

// mid = first + k
std::partial_sort(first, mid, last);
std::partial_sort(first, mid, last, cmp);

将序列中前 k 元素按 cmp 给定的顺序进行原地排序,后面的元素不保证顺序。未指定 cmp 函数时,默认按从小到大的顺序排序。

复杂度:约 $(\mathit{last}-\mathit{first})\log(\mathit{mid}-\mathit{first})$ 次应用 cmp

原理:

std::partial_sort 的思想是:对原始容器内区间为 [first, mid) 的元素执行 make_heap() 操作,构造一个大根堆,然后将 [mid, last) 中的每个元素和 first 进行比较,保证 first 内的元素为堆内的最大值。如果小于该最大值,则互换元素位置,并对 [first, mid) 内的元素进行调整,使其保持最大堆序。比较完之后,再对 [first, mid) 内的元素做一次对排序 sort_heap() 操作,使其按增序排列。注意,堆序和增序是不同的。

自定义比较

参见:运算符重载

内置类型(如 int)和用户定义的结构体允许定制调用 STL 排序函数时使用的比较函数。可以在调用该函数时,在最后一个参数中传入一个实现二元比较的函数。

对于用户定义的结构体,对其使用 STL 排序函数前必须定义至少一种关系运算符,或是在使用函数时提供二元比较函数。通常推荐定义 operator<。[^note1]

示例:

int a[1009], n = 10;
// ...
std::sort(a + 1, a + 1 + n);                  // 从小到大排序
std::sort(a + 1, a + 1 + n, greater<int>());  // 从大到小排序
struct data {
    int a, b;
    bool operator<(const data rhs) const {
        return (a == rhs.a) ? (b < rhs.b) : (a < rhs.a);
    }
} da[1009];

bool cmp(const data u1, const data u2) {
    return (u1.a == u2.a) ? (u1.b > u2.b) : (u1.a > u2.a);
}
// ...
std::sort(da + 1, da + 1 + 10);  // 使用结构体中定义的 < 运算符,从小到大排序
std::sort(da + 1, da + 1 + 10, cmp);  // 使用 cmp 函数进行比较,从大到小排序

严格弱序

参见:Strict weak orderings

进行排序的运算符必须满足严格弱序,否则会出现不可预料的情况(如运行时错误、无法正确排序)。

严格弱序的要求:

  1. $x \not&lt; x$(非自反性)
  2. $x &lt; y$,则 $y \not&lt; x$(非对称性)
  3. $x &lt; y, y &lt; z$,则 $x &lt; z$(传递性)
  4. $x \not&lt; y, y \not&lt; x, y \not&lt; z, z \not&lt; y$,则 $x \not&lt; z, z \not&lt; x$(不可比性的传递性)

常见的错误做法:

  • 使用 <= 来定义排序中的小于运算符。
  • 在调用排序运算符时,读取外部数值可能会改变的数组(常见于最短路算法)。
  • 将多个数的最大最小值进行比较的结果作为排序运算符(如皇后游戏/加工生产调度 中的经典错误)。

补充

习题

[!NOTE] LeetCode 1451. 重新排列句子中的单词

题意: TODO

[!TIP] 思路

按长度稳定排序。

stringstream + stable_sort

详细代码
C++
class Solution {
public:
    string arrangeWords(string text) {
        vector<string> ws;
        stringstream ss(text);
        string t;
        while (ss >> t) ws.push_back(t);
        if (!ws.empty()) ws[0][0] = tolower(ws[0][0]);

        stable_sort(ws.begin(), ws.end(), [](const string& a, const string& b) {
            return a.size() < b.size();
        });
        string res;
        for (auto s : ws) {
            res += s;
            res += " ";
        }
        if (!res.empty()) res[0] = toupper(res[0]);
        res.pop_back();
        return res;
    }
};
Python