当前位置: 首页 > news >正文

系统性能优化总结与思考-第一部分

1.C++代码优化策略总结

  • 编译器方面:用好的编译器并用好编译器(支持C++11的编译器,IntelC++(速度最快)
  • GNU的C++编译器GCC/G++(非常符合标准),Visual C++(性能折中),clang(最年轻Mac OS x)。
  • 算法方面:使用更好的算法。 
  • 数据结构优化:使用更好的数据结构(不同的数据结构在使用内存管理器的方式也有所不同)。
  • 使用更好的库(熟悉和掌握标准C++模板库对于进行性能优化的开发员是必须的技能,Boost Project 和 Google Code 公开了很多有用的库)。
  • 内存优化:减少内存分配和复制(减少对内存管理器的调用是一种非常有效的优化手段)。
  • 优化内存管理(内存管理器的调度,丰富的API)。
  • 移除计算(对于单条的C++语句进行优化)。
  • 多线程使用:提高并发性(多个处理核心执行指令)。
  • 优化锁的使用:减少锁的使用,减少锁的范围,使用细粒度的锁,采用无锁队列,原子锁或线程局部存储,锁数据而不是代码。

2.影响计算机优化的行为

  • 计算机的物理组成本身对计算机性能的限制。
  • 计算机的主内存是比较慢的(通往主内存的接口是限制执行速度的瓶颈(冯*诺伊曼瓶颈),(摩尔定理)每年处理器的核心的数量都会增加,但是计算机的性能未必会提高,因为这些核心只是等待访问内存的机会(内存墙memory wall))。 
  • 计算机内存的访问方式(并非以字节为单位),某些内存访问会比其他的更慢(分为一级高速缓存(cache memory)、二级高速缓存、三级高速缓存、主内存、磁盘上的虚拟内存页)。
  • 内存的容量是有限的,每个程序都会与其他程序竞争计算机资源,计算比做决定快。 
  • 在处理器中,访问内存的性能开销远比其他操作的性能开销大,非对齐访问所需要的时间是所有字节都在同一字节中的两倍。 
  • 访问频繁使用的内存地址的速度比访问非频繁使用的地址快,访问相邻地址的内存的速度比访问相互远隔的地址的内存块。 
  • 访问线程间共享的数据比访问非共享的数据资源慢很多。当并发线程共享数据时,同步代码降低了并发量。 
  • 有些语句隐藏了大量的计算,从语句的外表上看不出语句的性能开销会有多大。

3.性能测量

  • 90/10规则:一个程序会花费90%的运行时去执行10%的代码。
  • 只有正确且精确的测量才是准确的测量。 
  • 在Windows上,clock()函数提供了可靠的毫秒级的时钟计时功能。在Windows8和之后的版本中,GetSystemTimePreciseAsfileTime()提供了亚微秒的计时功能。
  • 计算一条C++语句对内存的读写次数,可以估算出一句C++ 语句的性能开销。

4.优化方法

(1)优化热点语句

  • 缓存循环结束条件值

  • 从循环中移除不变性代码

  • 从循环中移除无谓的函数调用

  • 从循环中移除隐含的函数调用

(2)减少函数调用开销

函数调用开销分析

尽管执行函数体的开销可能会非常大,但是调用函数的开销与调用大多数 C++ 语句的开销 一样,是非常小的。不过,当函数被多次调用时,累积的开销可能会变得巨大,因此减少 这种开销非常重要

函数调用流程

(1) 执行代码将一个栈帧推入到调用栈中来保存函数的参数和局部变量。

(2) 计算每个参数表达式并复制到栈帧中。

(3) 执行地址被复制到栈帧中并生成返回地址。

(4) 执行代码将执行地址更新为函数体的第一条语句(而不是函数调用后的下一条语句)。

(5) 执行函数体中的指令。

(6) 返回地址被从栈帧中复制到指令地址中,将控制权交给函数调用后的语句。

(7) 栈帧被从栈中弹出。

函数调用的基本开销

虚函数调用开销

(3)简短地声明内联函数

(4)在使用之前定义函数:当编译器编译对某个函数的调用时发现该函数已经被定义了,那么编译器能够自主选择内联这次函数调用

(5)移除未使用的多态性

(6)放弃不使用的接口

(7)用switch替代if-else if-else

(8)避免使用PIMPL惯用法,编译时间少,运行增加

(8)其他常用优化方法

4.多线程优化-未完待续

相关文章:

  • 简简单单实现一个Python+Selenium的自动化测试框架
  • LabVIEW 发电机励磁系统监测与诊断
  • CExercise_05_1伪随机数_1写一个随机发牌程序,由用户指定发几张票,然后打印用户得到的手牌。
  • 前端常考面试题目详解
  • 软件更新 | 以太网通信仿真功能已上线!TSMaster 202503 版本更新速览
  • C++中的高阶函数
  • Redis之缓存穿透
  • 【NLP】24. spaCy 教程:自然语言处理核心操作指南(进阶)
  • 《AI大模型应知应会100篇》第5篇:大模型发展简史:从BERT到ChatGPT的演进
  • InnoDB的MVCC实现原理?MVCC如何实现不同事务隔离级别?MVCC优缺点?
  • 基于LangGraph的智能报告生成平台项目分析
  • 树莓派超全系列教程文档--(23)内核参数
  • kubectl命令补全以及oc命令补全
  • ArmSoM Sige5 CM5:RK3576 上 Ultralytics YOLOv11 边缘计算新标杆
  • 【KWDB创作者计划】容器赋能KaiwuDB:探索浪潮数据库KWDB2.2.0 实战指南
  • LLM做逻辑推理题-确定他们的民族
  • JS—大文件上传
  • AI与无人驾驶汽车:如何通过机器学习提升自动驾驶系统的安全性?
  • vs code Cline 编程接入Claude 3.7的经济方案,且保持原生接口能力
  • css 练习01
  • 云南省交通发展投资有限责任公司原党委书记、董事长陈以东接受审查调查
  • 上海自然博物馆下月开启中国恐龙大展,还在筹备中国古人类大展
  • 一季度全社会用电量同比增长2.5%,3月增速显著回升
  • 工信部:加快推进6G技术研发等,前瞻布局和培育面向6G的应用产业生态
  • 铁路12306开始发售5月1日车票,系统保持安全平稳运行
  • 上海加大对中小微企业信贷支持力度,奖补资金规模提升到5亿元