颜林林的个人网站

从flat_set管窥C++的价值权衡

2024-01-07 03:31
题图
(题图由AI生成)

前几天,有朋友催更 C++ 系列,让讲讲 flat_set 之类。今天,就来写这篇半命题作文。顺便也宣布下:欢迎催更,欢迎指定题目或内容,这也是对我的肯定,虽然从响应时间上,我无法给出绝对的承诺,但我保证,我一定会尽力尽早满足的。

-----

1. 最基本的集合容器 std::set

在C++标准库中,提供了大量的容器,用于按照特定方式存放一组数据,并通过一系列形式上统一的函数调用接口,以及各种经过仔细权衡和大量测试的优质算法,来对这些数据进行操作。

这其中有一类相对简单的容器,就是集合。集合通常会要求没有重复元素。最基本的集合类就是 std::set。

之前我在《从C++语法特性检查想到的》一文中提到过,“在C/C++中,自己造的轮子,超越标准库是有可能的”。因为“作为标准库,需要适应各种复杂使用场景,需要具备广泛的支持能力,这成为了沉重的负担”。从标准库针对同一类容器,提供了不止一种选择,就可以看出这种需要权衡考虑、并支持各种场景的沉重负担。

标准的集合类 std::set,是一个中庸的选择,它底层使用红黑树(一种最常见的平衡二叉树),来确保每次对容器内容的调整(如插入、删除),都能在 O(n * log(n)) 时间复杂度内完成。这同时也使得它,如同在标准中规定的,可以保证容器元素是经过排序的(即从 std::begin() 遍历到 std::end() 是正序的;如果是整数元素,则是从小到大排序)。红黑树算法的高效,使得 std::set 足以应付日常大多数场景了。

2. 标准库中的其他集合容器

但是,凡事总有例外,而且,在追求性能极致的C++极客眼中,每次访问一个元素都要经历 O(log(n)),每次插入或删除一个元素都要经历 O(n * log(n)),实在是难以忍受的折磨。为什么非要搞个二叉树?为什么不能用哈希(hash),从而实现常数时间复杂度?嗯,这是可以的,这就是 std::unordered_set。

有了 std::unordered_set,是不是它与 std::set 配合,就足够打遍天下了呢?当然不是,计算机的世界并不总是跟数学的世界对应。有时候,为了实现一些特殊需求,我们还希望集合里允许重复元素出现。可以吗?难道不可以吗?可以!只要是“合理”的需求,极客们总是有办法满足的。于是在标准库中,又出现了 std::multiset 和 std::unordered_multiset。(注:std::set 和 std::multiset 是一开始在 C++03 时就有的,而 std::unordered_set 和 std::unordered_multiset 是在 C++11 中加入的。)

然而,哈希也并不完美,虽然号称是常数时间,但毕竟要通过哈希函数计算和重新寻址,因而各元素并不存放在空间连续的内存中,远不如 std::vector 来得顺眼。有没有办法解决这个问题,让“好处占尽”呢?这就轮到本文的主角 flat_set 登场了。

3. 将 std::vector 当成集合来用

std::vector 是标准库中最接近完美的容器,因为它可以直接对应到物理意义上的一块连续内存,并通过容器标准函数进行各类常见操作,而且很方便将其与其他不同类型容器之间,进行复制、转移或变换。这简直就是把洁癖到容不下各种复杂封装、恨不得直接写C或汇编,但又割舍不掉种种高级语言的丰富类库函数操作和优雅写法,完美地结合起来并加以满足。

于是,我们总是不免希望,能用 std::vector 的地方,就尽量选择它(C++中的最佳实践,确实也都是这么建议的),包括集合类需求的场景。在C++中有一种技术,名为“容器适配器”(container adaptors),就是把标准容器进行“适配”包装,使其表现得像另外一种不同的、甚至大相径庭的容器。flat_set 正是通过这种技术,使得一个在内存中以连续存储方式保存元素的数据结构,对外表现得跟 std::set 一样。

这么折腾一圈,到底图啥呢?其实核心在于“性能”,这个永恒的话题!

4. 关于选择 flat_set 的权衡

flat_set 的性能优势主要在于几个方面:

更好的缓存局部性:由于数据存储在连续的内存块中,flat_set的元素可以更有效地利用CPU缓存,提高访问速度。

优化的迭代性能:连续存储也使得迭代器遍历速度更快,尤其是在访问大量数据时。

可自定义的存储分配器:是的,关于“以std::vector来存储”这件事,flat_set 并未完全剥夺用户的选择权,它提供了一个模板参数,来允许用户指定其他特定的底层容器和分配器,从而可为具体场景进行内存使用优化。

这里顺道补充划个重点:优化考虑到这份上,其实简直就是奔着嵌入式支持去的。虽然很多时候做嵌入式会受限于硬件厂商提供的交叉编译环境,以至于只能采用旧版的 gcc 或 STL,但如果能设法重新编译并升级到较新的版本,把这些更好的 C++ 新标准及其标准库用起来,实在会是一件大幅提升开发效率的事。 因此,它所适合的应用场景包括: 大量数据访问:当需要频繁地读取集合中的元素时,flat_set 的连续内存布局提供了优势。

性能关键型应用:在延迟敏感的应用中,flat_set 的高迭代速度和优秀的缓存局部性可以带来显著的性能提升。

内存使用优化:如果内存使用是一个关键问题,flat_set 允许更细粒度的控制,如自定义分配器和预留空间。 当然,任何事都是在做选择(如同我在《我在创业中的抉择与思考(上)》一文中提到的理念),选择使用 flat_set,获得并享受其优势的同时,自然也是要付出代价的。其代价至少包括: 插入和删除代价:由于需要保持元素顺序,插入和删除操作可能需要移动多个元素,这使得这些操作的成本较高。

初始构建成本:构建一个大的 flat_set 可能比标准集合更耗时,因为它需要排序和移动元素。

5. flat_set 的使用

不知道你是否注意到,在描述其他容器时,我都会加上 std:: 前缀,但 flat_set 却没有。其实,主要是因为,到目前为止,我们都还无法使用 std::flat_set。

C++23 标准计划将 flat_set 引入,但我们还需要等待该标准的最后审批通过和正式发布,以及各编译器厂商的相应跟进实现。在这件事发生之前,我们可以通过 boost 类库来使用它,这就不是 std::flat_set,而是boost::container::flat_set 了。

所以,期待 C++23 的正式发布,到时候应该就可以大大方方地直接使用 std::flat_set 了。

-----

篇幅差不多了,这篇暂且打住。写完我才发现,这样一篇计算机语言技术类文章,我竟然没有留下一丝提供代码展示的空间。算了,就这样吧,这次就当闲聊,下次再补代码吧。

--- END ---

注:本文首发表于“不靠谱颜论”公众号,并同步至本站。

相关文章