优化级别说明(仅供参考) :
则其中的 Code Optimization 栏就是用来设置 C51 的优化级别。共有 9 个优化
级别(书上这么写的) ,高优化级别中包含了前面所有的优化级别。现将各个级
别说明如下:
0 级优化:
1、 常数折叠:只要有可能,编译器就执行将表达式化为常数数字的计算,其中
包括运行地址的计算。
2、 简单访问优化:对 8051 系统的内部数据和位地址进行访问优化。
3、 跳转优化:编译器总是将跳转延至最终目标上,因此跳转到跳转之间的命令
被删除。
1 级优化:
1、 死码消除:无用的代码段被消除。
2、 跳转否决:根据一个测试回溯,条件跳转被仔细检查,以决定是否能够简化
或删除。
2 级优化:
1、 数据覆盖:适于静态覆盖的数据和位段被鉴别并标记出来。连接定位器 BL51
通过对全局数据流的分析,选择可静态覆盖的段。
3 级优化:
1、“窥孔”优化:将冗余的 MOV 命令去掉,包括不必要的从存储器装入对象及
装入常数的操作。另外如果能节省存储空间或者程序执行时间,复杂操作将由简
单操作所代替。
4 级优化:
1、 寄存器变量:使自动变量和函数参数尽可能位于工作寄存器中,只要有可能,
将不为这些变量保留数据存储器空间。
2、扩展访问优化:来自 IDATA、XDATA、PDATA 和 CODE 区域的变量直接包
含在操作之中,因此大多数时候没有必要将其装入中间寄存器。
3、局部公共子式消除:如果表达式中有一个重复执行的计算,第一次计算的结
果被保存,只要有可能,将被用作后续的计算,因此可从代码中消除繁杂的计算。
4、CASE/SWITCH 语句优化: 将 CASE/SWITCH 语句作为跳转表或跳转串优化。
5 级优化:
1、 全局公共子式消除:只要有可能,函数内部相同的子表达式只计算一次。中
间结果存入一个寄存器以代替新的计算。
2、 简单循环优化:以常量占据一段内存的循环再运行时被优化。
6 级优化:
1、 回路循环:如果程序代码能更快更有效地执行,程序回路将进行循环。
7 级优化:
1、 扩展入口优化:在适合时对寄存器变量使用 DPTR 数据指针,指针和数组访
问被优化以减小程序代码和提高执行速度。
8 级优化:
1、 公共尾部合并:对同一个函数有多处调用时,一些设置代码可被重复使用,
从而减小程序代码长度。
9 级优化:
1、 公共子程序块:检测重复使用的指令序列,并将它们转换为子程序。C51 甚
至会重新安排代码以获得更多的重复使用指令序列。
当然,优化级别并非越高越好,应该根据具体要求适当选择。
KeilC51 的编译器有一个优化设置,不同的优化设置,会产生不同的编译结果。一
般情况缺省编译优化设置被设定为 8 级优化,实际最高可设定为 9 级优化:
1. Dead code elimination。
2.Data overlaying。
3.Peephole optimization。
4.Register variables。
5.Common subexpression elimination。
6.Loop rotation。
7.Extended Index Access Optimizing。
8.Reuse Common Entry Code。
9.Common Block Subroutines。
附表:Keil C51 中的优化级别及优化作用 级别 说明
0 常数合并:编译器预先计算结果,尽可能用常数代替表达式。包括运行
地址计算。
优化简单访问:编译器优化访问 8051 系统的内部数据和位地址。
跳转优化:编译器总是扩展跳转到最终目标,多级跳转指令被删除。
1 死代码删除:没用的代码段被删除。
拒绝跳转:严密的检查条件跳转,以确定是否可以倒置测试逻辑来改进或删除。
2 数据覆盖:适合静态覆盖的数据和位段被确定,并内部标识。BL51 连
接/定位器可以通过全局数据流分析,选择可被覆盖的段。
3 窥孔优化:清除多余的 MOV 指令。这包括不必要的从存储区加载和常
数加载操作。当存储空间或执行时间可节省时,用简单操作代替复杂操作。
4 寄存器变量:如有可能,自动变量和函数参数分配到寄存器上。为这些
变量保留的存储区就省略了。
优化扩展访问:IDATA、XDATA、PDATA 和 CODE 的变量直接包含在操作中。
在多数时间没必要使用中间寄存器。
局部公共子表达式删除:如果用一个表达式重复进行相同的计算,则保存第一次
计算结果,后面有可能就用这结果。多余的计算就被删除。
Case/Switch 优化:包含 SWITCH 和 CASE 的代码优化为跳转表或跳转队列。
5 全局公共子表达式删除: 一个函数内相同的子表达式有可能就只计算一
次。中间结果保存在寄存器中,在一个新的计算中使用。
简单循环优化:用一个常数填充存储区的循环程序被修改和优化。
6 循环优化:如果结果程序代码更快和有效则程序对循环进行优化。
7 扩展索引访问优化:适当时对寄存器变量用 DPTR。对指针和数组访问
进行执行速度和代码大小优化。
8 公共尾部合并:当一个函数有多个调用,一些设置代码可以复用,因此
减少程序大小。
9 公共块子程序:检测循环指令序列,并转换成子程序。Cx51 甚至重排
代码以得到更大的循环序列。
优化论
谈到优化,其实很多人都哭笑不得,因为在一个 C51 软件工程师的生涯中,总要被
KEIL 的优化耍那么一次到几次。 我被耍过,想必看着文章的你也被耍过,如果你回
答说不,那只能说你写的 C51 程序不多!
看看 KEILC 的优化级别选项吧:
0-9 共 10 个级别的优化,0 是最低,9 最高,一个普通的程序,设置最高级别和最低级
别,编译后代码量有时会相差很远,以 DX 板 DEMO 程序为例,0 级优化后是 14K
的 CODE,9 级优化后是 10K 的 CODE,前后相差了 4K。 可见这个差别是多么的大。
事实上我们不需要知道对应的各个级别 KEIL会如何优化你的程序或优化了些什
么,我们只需要以一种严谨的态度去编写和对待你的程序就可以了。在我个人的
观念中,程序在 9 级优化后依然能保持完美无误的运行,你才算了解 KEIL 的脾气。
好了,还是说点正点的:
有些人习惯整体程序都选择同一个优化级,事实上每个 C 文件都可以有独立的优
化级别的:
在工作区右键选择你的模块(.C)然后选取 Options for File xxx 就会出现如下界
面:
在 C51 选项中就可以选择优化级别和警告级别等东西了,被独立设置过的 C 文件
会有特殊的标记的:
用以提醒你这个文件的编译处理并非默认设置!
如果你觉得模块优化都不够细的话,你可以考虑局部优化,也就是说对某个函数实
行某个级别的优化。当你发现 9 级优化的时候某个函数总是变的不正常,但你又
希望其它函数和程序段保持最高的简洁度,那么局部优化可以说是相当有用的
了。在 KEIL 手册中有介绍这个功能:
#pragma OPTIMIZE(x) x 就是你希望的优化级别,一般应用如下:
#pragma OPTIMIZE(6)
void FunA()
{ }
......
......
#pragma OPTIMIZE(9)
void FunB()
{ }
上面的意思就是说,在 void FunA()到 void FunB()之前的所有函数,包括 FunA 在内,
都采用 6 级的优化,而从 FunB 开始直到之后,只要没碰上#pragma OPTIMIZE,都采
用 9 级优化了。
OPTIMIZE 还可以多一个参数,就是 speed 和 size,
用法: #pragma OPTIMIZE(9,speed)或#pragma OPTIMIZE(5,size)
对应的就是 9 级优化,以速度为主,或 5 级优化,以空间最小为主。
在实际使用时发现仿真时有写程序是白色的无法进行断点设置
搜索到的答案是优化等级过高,一些普通的程序被优化。
只得把优化程序等级降低。