少写点 if-else 吧，它的效率有多低你知道吗？--粉丝服务平台-粉丝头条-fensifuwu.com

少写点 if-else 吧，它的效率有多低你知道吗？

日期： 2023-03-01 09:45:32 来源：菜鸟教程收集编辑：程序喵大人

来源 | 程序喵大人

作者 | 程序喵大人

首先看一段经典的代码，并统计它的执行时间：

// test_predict.cc#include <algorithm>#include <ctime>#include <iostream>
int main() {    const unsigned ARRAY_SIZE = 50000;    int data[ARRAY_SIZE];    const unsigned DATA_STRIDE = 256;
    for (unsigned c = 0; c < ARRAY_SIZE; ++c) data[c] = std::rand() % DATA_STRIDE;
    std::sort(data, data + ARRAY_SIZE);
    {  // 测试部分        clock_t start = clock();        long long sum = 0;
        for (unsigned i = 0; i < 100000; ++i) {            for (unsigned c = 0; c < ARRAY_SIZE; ++c) {                if (data[c] >= 128) sum += data[c];            }        }
        double elapsedTime = static_cast<double>(clock() - start) / CLOCKS_PER_SEC;
        std::cout << elapsedTime << "\n";        std::cout << "sum = " << sum << "\n";    }    return 0;}~/test$ g++ test_predict.cc ;./a.out7.95312sum = 480124300000

此程序的执行时间是 7.9 秒，如果把排序那一行代码注释掉，即：

// std::sort(data, data + ARRAY_SIZE);

结果为：

~/test$ g++ test_predict.cc ;./a.out24.2188sum = 480124300000

改动后的程序执行时间变为了 24 秒。

其实只改动了一行代码，程序执行时间却有 3 倍的差距，而且看上去数组是否排序与程序执行速度貌似没什么关系，这里面其实涉及到 CPU 分支预测的知识点。

提到分支预测，首先要介绍一个概念：流水线。

拿理发举例，小理发店一般都是一个人工作，一个人洗剪吹一肩挑，而大理发店分工明确，洗剪吹都有特定的员工，第一个人在剪发的时候，第二个人就可以洗头了，第一个人剪发结束吹头发的时候，第二个人可以去剪发，第三个人就可以去洗头了，极大地提高了效率。

这里的洗剪吹就相当于是三级流水线，在 CPU 架构中也有流水线的概念，如图：

在执行指令的时候，一般有以下几个过程：

取指：Fetch
译指：Decode
执行：execute
回写：Write-back

流水线架构可以更好地压榨流水线上的四个员工，让他们不停地工作，使指令执行的效率更高。

再谈分支预测，举个经典的例子：

火车高速行驶的过程中遇到前方有个岔路口，假设火车内没有任何通讯手段，那火车就需要在岔路口前停下，下车询问别人应该选择哪条路走，弄清楚路线后再重新启动火车继续行驶。高速行驶的火车慢速停下，再重新启动后加速，可以想象这个过程浪费了多少时间。

有个办法，火车在遇到岔路口前可以猜一条路线，到路口时直接选择这条路行驶，如果经过多个岔路口，每次做出选择时都能选择正确的路口行驶，这样火车一路上都不需要减速，速度自然非常快。但如果火车开过头才发现走错路了，就需要倒车回到岔路口，选择正确的路口继续行驶，速度自然下降很多。所以预测的成功率非常重要，因为预测失败的代价较高，预测成功则一帆风顺。

计算机的分支预测就如同火车行驶中遇到了岔路口，预测成功，程序的执行效率则大幅提高，预测失败，程序的执行效率则大幅下降。

CPU 都是多级流水线架构运行，如果分支预测成功，很多指令都提前进入流水线流程中，则流水线中指令运行得非常顺畅，而如果分支预测失败，则需要清空流水线中的那些预测出来的指令，重新加载正确的指令到流水线中执行，然而现代 CPU 的流水线级数非常长，分支预测失败会损失 10-20 个左右的时钟周期，因此对于复杂的流水线，好的分支预测方法非常重要。

预测方法主要分为静态分支预测和动态分支预测。

静态分支预测：听名字就知道，该策略不依赖执行环境，编译器在编译时就已经对各个分支做好了预测。
动态分支预测：即运行时预测，CPU 会根据分支被选择的历史记录进行预测，如果最近多次都走了这个路口，那 CPU 做出预测时会优先考虑这个路口。

了解了分支预测的概念，我们回到最开始的问题，为什么同一个程序，排序和不排序的执行速度相差那么多。

因为程序中有个 if 条件判断，对于不排序的程序，数据散乱分布，CPU 进行分支预测比较困难，预测失败的频率较高，每次失败都会浪费 10-20 个时钟周期，影响程序运行的效率。而对于排序后的数据，CPU 根据历史记录比较好判断即将走哪个分支，大概前一半的数据都不会进入 if 分支，后一半的数据都会进入 if 分支，预测的成功率非常高，所以程序运行速度很快。

如何解决此问题？总体思路肯定是在程序中尽量减少分支的判断，方法肯定是具体问题具体分析了，对于该示例程序，这里提供两个思路削减 if 分支。

方法一：使用位操作：

int t = (data[c] - 128) >> 31;sum += ~t & data[c];

方法二：使用表结构：

#include <algorithm>#include <ctime>#include <iostream>
int main() {    const unsigned ARRAY_SIZE = 50000;    int data[ARRAY_SIZE];    const unsigned DATA_STRIDE = 256;
    for (unsigned c = 0; c < ARRAY_SIZE; ++c) data[c] = std::rand() % DATA_STRIDE;
    int lookup[DATA_STRIDE];    for (unsigned c = 0; c < DATA_STRIDE; ++c) {        lookup[c] = (c >= 128) ? c : 0;    }
    std::sort(data, data + ARRAY_SIZE);
    {  // 测试部分        clock_t start = clock();        long long sum = 0;
        for (unsigned i = 0; i < 100000; ++i) {            for (unsigned c = 0; c < ARRAY_SIZE; ++c) {                // if (data[c] >= 128) sum += data[c];                sum += lookup[data[c]];            }        }
        double elapsedTime = static_cast<double>(clock() - start) / CLOCKS_PER_SEC;        std::cout << elapsedTime << "\n";        std::cout << "sum = " << sum << "\n";    }    return 0;}

其实 Linux 中有一些工具可以检测出分支预测成功的次数，有 valgrind 和 perf，使用方式如图：

条件分支的使用会影响程序执行的效率，我们平时开发过程中应该尽可能减少在程序中随意使用过多的分支，能避免则避免。

参考资料

http://matt33.com/2020/04/16/cpu-branch-predictor/
https://zhuanlan.zhihu.com/p/22469702
https://en.wikipedia.org/wiki/Branch_predictor
https://stackoverflow.com/questions/11227809/why-is-processing-a-sorted-array-faster-than-processing-an-unsorted-array

服务粉丝

少写点 if-else 吧，它的效率有多低你知道吗？

文章推荐

相关阅读

解放爸妈！2-6岁冬令营大盘点，这个寒假不浪费～

被Linux之父骂醒？英伟达破天荒开源GPU内核驱动，网友：活久见

今日9点，查成绩！

漫画：为什么程序员没有女朋友？

漫画：国内都有哪些程序员大牛？

双12，这里有66张打印优惠劵！

我独立开发的产品是怎样获得最初的 300 个用户的？

不上班的1000天，我的程序员自由职业 B 计划 - 做了什么/收入怎样/以及经验教训

助力实体经济，13亿一起

坐地铁，能赚钱

聚合标签

热门文章

百元茅台没人买，千元茅台有人追。十年前，有人花百元买了一万股茅台，后出手追中石油，如今，茅台一飞冲天，中石油深套十年。炒股，不要见异思迁，价值投资是首选。#股票#

谁说定期存款提前支取不划算？存中原银行“惠农宝”放心随便取

张小龙:交了8千万税无北京户籍孩子连私立也不让上

万字详解：ROE连续十年超过20的明星公司全面分析（附：详细名单）

“复活”半年后　京东拍拍二手杀入公益事业

离职时没有做满一个月，公司还需要帮纳当月社保吗？

最新文章

少写点 if-else 吧，它的效率有多低你知道吗？

IT 行业一些常见的招聘术语！

救命，“手撕鬼子”全球化了？！

画面太美，把我看吐了

国内看不到的题材，韩国人给拍了

她好美，可惜被毁了