作为一位拥有十几年嵌入式开发经验的资深专家,
一口君发现许多初学者在编写代码时常常滥用全局变量,
他们会在一个模块中定义大量的全局变量,甚至在函数内部也是全局变量的大集合,
这种代码堆积如山,效率低下,难以维护,几乎无法在不同平台上移植,
但却有极高的防御性!(事事有利弊)
许多初学者之所以不将这些变量封装到一个结构体中,主要是出于方便考虑,
但要知道,这实际上是一种不良的编程习惯,而且会影响整体代码的性能。
最近在与嵌入式专家【公众号:裸机思维】的交流中,他提到:“实际上,Cortex在架构设计上更偏向面向对象(即使只是使用了结构体),其表现形式是:Cortex所有的寻址模式都是间接寻址——换句话说必须依赖一个寄存器作为基地址。
举例来说,以前在8位和16位微处理器时代,人们习惯于为每个寄存器单独分配地址——将其视为全局变量来访问,而如今,Cortex架构更鼓励底层驱动以寄存器页(即结构体)为单位来定义寄存器,这意味着,同一外设的寄存器是通过拥有相同基地址的结构体来访问的。”
以Cortex A9架构为例,下文将详细解释为何使用结构体能提高效率。
一、全局变量反汇编
1. 源文件
gcd.s
.text
.global _start
_start:
ldr sp,=0x70000000 /*get stack top pointer*/
b main
main.c
/*
* main.c
*
* Created on: 2020-12-12
* Author: pengdan
*/
int xx=0;
int yy=0;
int zz=0;
int main(void)
{
xx=0x11;
yy=0x22;
zz=0x33;
while(1);
return 0;
}
map.lds
OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm")
/*OUTPUT_FORMAT("elf32-arm", "elf32-arm", "elf32-arm")*/
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS
{
. = 0x40008000;
. = ALIGN(4);
.text :
{
gcd.o(.text)
*(.text)
}
. = ALIGN(4);
.rodata :
{ *(.rodata) }
. = ALIGN(4);
.data :
{ *(.data) }
. = ALIGN(4);
.bss :
{ *(.bss) }
}
Makefile
TARGET=gcd
TARGETC=main
all:
arm-none-linux-gnueabi-gcc -O1 -g -c -o $(TARGETC).o $(TARGETC).c
arm-none-linux-gnueabi-gcc -O1 -g -c -o $(TARGET).o $(TARGET).s
arm-none-linux-gnueabi-gcc -O1 -g -S -o $(TARGETC).s $(TARGETC).c
arm-none-linux-gnueabi-ld $(TARGETC).o $(TARGET).o -Tmap.lds -o $(TARGET).elf
arm-none-linux-gnueabi-objcopy -O binary -S $(TARGET).elf $(TARGET).bin
arm-none-linux-gnueabi-objdump -D $(TARGET).elf > $(TARGET).dis
clean:
rm -rf *.o *.elf *.dis *.bin
【交叉编译工具,自行搜索安装,或者后台回复arm】
2. 反汇编结果:
由上图可知,每存储1个int型全局变量需要8个字节,
literal pool (文字池)占用4个字节
literal pool的本质就是ARM汇编语言代码节中的一块用来存放常量数据而非可执行代码的内存块。
使用literal pool (文字池)的原因
当想要在一条指令中使用一个 4字节长度的常量数据(这个数据可以是内存地址,也可以是数字常量)的时候,由于ARM指令集是定长的(ARM指令4字节或Thumb指令2字节),所以就无法把这个4字节的常量数据编码在一条编译后的指令中。此时,ARM编译器(编译C源程序)/汇编器(编译汇编程序) 就会在代码节中分配一块内存,并把这个4字节的数据常量保存于此,之后,再使用一条指令把这个4 字节的数字常量加载到寄存器中参与运算。
在C源代码中,文字池的分配是由编译器在编译时自行安排的,在进行汇编程序设计时,开发者可以自己进行文字池的分配,如果开发者没有进行文字池的安排,那么汇编器就会代劳。
bss段占用4个字节
每访问1次全局变量,总共需要3条指令,访问3次全局变量用了12条指令。
14. 通过当前pc值40008018偏移32个字节,找到xx变量的链接地址40008038,然后取出其内容40008044存放在r3中,该值就是xx在bss段的地址
15. 通过将立即数0x11即#17赋值给r2
16. 将r2的内让那个写入到r3对应的指向的内存,即xx标号对应的内存中
二、结构体反汇编
1. 修改main.c如下:
/*
2 * main.c
3 *
4 * Created on: 2020-12-12
5 * Author: 一口Linux
6 */
7 struct
8 {
9 int xx;
10 int yy;
11 int zz;
12 }peng;
13 int main(void)
14 {
15 peng.xx=0x11;
16 peng.yy=0x22;
17 peng.zz=0x33;
18
19 while(1);
20 return 0;
21 }
2. 反汇编代码如下:
由上图可知:
-
结构体变量peng位于bss段,地址是4000802c -
访问结构体成员也需要利用pc找到结构体变量peng对应的文字池中地址40008028,然后间接找到结构体变量peng地址4000802c
与定义成3个全局变量相比,优点:
-
结构体的所有成员在literal pool 中共用同一个地址;而每一个全局变量在literal pool 中都有一个地址,节省了8个字节。 -
访问结构体其他成员的时候,不需要再次装载基地址,只需要2条指令即可实现赋值;访问3个成员,总共需要7条指令,节省了5条指令
彩!
所以对于需要大量访问结构体成员的功能函数,所有访问结构体成员的操作只需要加载一次基地址即可。
使用结构体就可以大大的节省指令周期,而节省指令周期对于提高cpu的运行效率自然不言而喻。
所以,重要问题说3遍
尽量使用结构体尽量使用结构体尽量使用结构体
三、继续优化
那么指令还能不能更少一点呢?答案是可以的, 修改Makefile如下:
TARGET=gcd
TARGETC=main
all:
arm-none-linux-gnueabi-gcc -Os -lto -g -c -o $(TARGETC).o $(TARGETC).c
arm-none-linux-gnueabi-gcc -Os -lto -g -c -o $(TARGET).o $(TARGET).s
arm-none-linux-gnueabi-gcc -Os -lto -g -S -o $(TARGETC).s $(TARGETC).c
arm-none-linux-gnueabi-ld $(TARGETC).o $(TARGET).o -Tmap.lds -o $(TARGET).elf
arm-none-linux-gnueabi-objcopy -O binary -S $(TARGET).elf $(TARGET).bin
arm-none-linux-gnueabi-objdump -D $(TARGET).elf > $(TARGET).dis
clean:
rm -rf *.o *.elf *.dis *.bin
仍然用第二章的main.c文件
执行结果
可以看到代码已经被优化到5条。
14. 把peng的地址40008024装载到r3中
15. r0写入立即数0x11
16. r1写入立即数0x22
17. r0写入立即数0x33
18. 通过stm指令将r0、r1、r2的值顺序写入到40008024内存中
以上就是良许教程网为各位朋友分享的Linu系统相关内容。想要了解更多Linux相关知识记得关注公众号“良许Linux”,或扫描下方二维码进行关注,更多干货等着你 !