让我来谈谈编译器的用法
学习arm编译器
首先让我们了解一下编译器,通常由三个主要部分组成:前端、优化器和后端。
-
前端:负责词法分析、语法分析和语义分析,将源代码转换为抽象语法树,并生成中间代码。 -
优化器:对生成的中间代码进行优化,使得代码更加高效。 -
后端:将优化后的代码转换为特定平台的机器代码。
简单来说,编译器的工作流程是:源代码 -> 预处理 -> 编译 -> 目标代码 -> 链接 -> 可执行程序。
再来简单看看一些编译器的历史,GCC、LLVM以及Clang等,以及文章介绍的armcc 以及armclang。
-
GCC (GNU Compiler Collection)是GNU开发的编译器,许可证为GPL的自由软件; -
GCC 原来只能处理C,现在可以处理C++、Pascal、Object-C、Java等。 -
苹果公司之前一直使用GCC作为编译器,但是GCC对Objective-C支持一直不怎么好,好多新特性没有增加,所以苹果公司开始寻求编译器的替代品。 -
这个时候LLVM就出现了,是Chris Lattner在硕士和博士时提出和形成的编译器,不过其是采用GCC的前端进行语义分析,然后LLVM做优化和生成目标代码,可以叫做LLVM-GCC。 -
后来苹果公司直接计划绕开GCC,于是招募了Chris Lattner 博士开发编译器,Clang就这样诞生了,其基于LLVM开发的C/C++/Obj-C编译器,实际上其是一个编译器前端,来取代GCC或者超越GCC -
armcc 是arm 公司开发的一款编译器,集成在KEIL以及ARM DS IDE里面,于5.06版本后停滞(AC5),不继续维护,其前端基于 Edison Design Group 。 -
armclang 集成于armcc,基于新的架构 clang 和LLVM,作为arm 的第六代编译器,AC6,成为今后主推的编译器。
armcc 编译器
arm 公司 开发的一款编译器,在2005年收购 KEIL 公司后,这块编译器就集成在KEIL IDE里面,以及自家开发的ARM DS5,编译器以及IDE相关的文档可以去ARM 公司的官网下载。
下载的文档主要分几个部分:armcc 编译器、armasm 汇编器、armlink 链接器、armar 打包以及fromelf bin文件。
1、armcc
armcc 编译器 主要是编译.c/.cpp源文件文件,生成目标文件,通过各种编译选项 command-line来支持各种特性。接着来罗列几个常见的编译选项。
一般的arm cc的编译器的编译器的语法如下:
armcc [options] [source]
举例如下:
armcc -I ../common/ -I ../driver -g --apcs=interwork --cpu=Cortex-R5 -c ../common/led.c -o ../out/led.o
123
-
-c/-C/-o/-D-c 代表 只是编译,不进入链接步骤, -C 保留预处理的输出,然后-E 可以指定预处理输出到某个指定文件。
armcc -c -C -E -I ../common/ -I ../driver -g --apcs=interwork --cpu=Cortex-R5 ../common/led.c -o ../out/led.i
这样之后,可以看到预处理的结果,比如宏替换后的结果,方便分析问题。
12
-o 指定输出的文件名称
-D 定义宏名称,例如:-DLOG -DUART=1 -U 移除已经定义的宏名称
#define LOG
#define UART 1
在编译器命令行指定上面的宏,相当于在程序里面定义上述代码的定义
1234
-
-I:指定include的目录 ,如果路径没指定,编译阶段就会报错,找不到相关的文件,相比大家都见过这个错误吧! -
–c99 –c90 指的的是C语言的语法版本, -
–cpu=name 比如 –cpu=Cortex-R5 -
图片 -
-M/–md 这两个是用来为每个源文件产生编译依赖,–md 生成.d文件,表示这个目标文件所依赖的头文件。这个在增量编译非常有用,再找到依赖关系后,更新依赖,则可以只编译修改的文件以及依赖的文件。
armcc -c -M -I ..\SYSTEM\sys -I ... sys.c --no_depend_single_line --md
1
在这里插入图片描述
-
–diag_error/–diag_suppress/–diag_warning 对编译的警告以及错误进行处理,比如屏蔽某个编译警告/错误
--diag_error=warning 将err的编译消息视为warning,
--diag_suppress=3017,1256,1148 将编译消息 编码为 3017,1256,1148的诊断消息屏蔽
--diag_warning=1234,5678 屏蔽编码为 1234,5678的warning的诊断消息
--diag_warning=error 将warning视为error
1234
例如下面的20、223 这种编码序号。
在这里插入图片描述
-
–feedback=filename 编译反馈,主要是用来去除没有用到的代码 (数据以及code),需要与链接的选项一起使用,通常需要编译两次。
--feedback=unused_section.txt 编译器阶段把没用到的代码和code单独放在一个section,方便链接阶段去除,链接阶段,生成不用的section区
--feedback=image_none 忽略链接阶段的链接脚本,忽略代码布局,则不会生成axf文件
--remove 去除不用的section
--keep memory_alyout.o\(rw\) 可以设置memory_out.o中的rw段不删除
通过feedback,空间从950k -> 800k (双core的bin 所需空间)
12345
-
–inline/–forceinline
前者会对函数是否内敛进行考虑,后者强制将所有函数进行内敛,要对单个函数进行内敛,可以考虑对函数进行修饰,__forceinline。
-
-
需要注意的是,并不是所有的函数都可以内联,比如递归函数。
-
-
–littleend/–bigend 数据大小端设置, -
image-20240107200743753 -
-O0/O1/O2/O3/Otime/Ospace 编译优化选项
-O0最小优化。关闭大多数优化。启用调试时,此选项提供最佳调试视图,因为生成代码的结构直接对应于源代码。所有干扰调试视图的优化都被禁用。
-
可以在任何可到达的点设置断点,包括死代码(程序执行不到的地方 或者没有受调用的地方)。 -
变量的值在其范围内的任何地方都可用,但它所在的位置除外未初始化。 -
Backtrace 提供了读取源代码时预期的函数调用栈关系。 -
虽然 -O0 生成的调试视图与源代码最接近,但用户可能更喜欢 -O1 生成的调试视图,因为这提高了代码的质量在不改变基本结构的情况下。 -
死代码包括对程序结果没有影响的可达代码,例如对从未使用过的局部变量的赋值。无法访问的代码是专门的代码无法通过任何控制流路径访问,例如紧跟在返回之后的代码 陈述。
-O1受限优化。编译器只执行可以描述为调试信息的优化。删除未使用的内联函数和未使用的静态函数。关掉严重降低调试视图的优化。如果与 –debug 一起使用,此选项会给出总体上令人满意的调试视图且具有良好的代码密度。调试视图与 –O0 的区别在于:
-
不能在死代码上设置断点。 -
变量的值在初始化后可能在其范围内不可用。例如,如果他们分配的位置已被重复使用。 -
没有影响的函数可能会被乱序调用,或者如果结果是不需要的。 -
Backtrace 可能不准确,因为在栈的方面处理有变化,存在调用优化。 -
优化级别 –O1 在源代码和对象之间产生良好的对应关系代码,特别是当源代码不包含死代码时。 -
生成的代码可以是明显小于 –O0 处的代码,这可以简化目标代码的分析。
-O2高度优化。如果与 –debug 一起使用,调试视图可能不太令人满意,因为目标代码到源代码的映射并不总是清晰的。编译器可能会执行调试信息无法描述的优化。这是默认的优化级别。调试视图与 –O1 的区别在于:
-
源代码到目标代码的映射可能是多对一的,因为可能多个源代码位置映射到目标文件的一个点,更激进的指令优化。 -
允许指令调度跨越序列点。这可能导致变量在特定点的报告值与期望的值不匹配。 -
编译器自动内联函数
-O3最大优化。启用调试后,此选项通常会提供较差的调试视图。ARM 建议在较低的优化级别进行调试。如果同时使用 -O3 和 -Otime,编译器会执行更积极的额外优化,例如:
-
高级标量优化,包括循环展开。这可以给显着以较小的代码大小成本获得性能优势,但存在构建时间较长的风险。 -
更积极的内联和自动内联。 -
这些优化有效地重写了输入源代码,导致目标代码与源代码的最低对应和最差的调试视图。–loop_optimization_level=option ,控制在 –O3 –Otime 执行的循环优化效果。循环优化的数量越高,源代码和目标代码之间的对应关系就越差。 -
使用 –vectorize 选项还降低了源代码和目标代码之间的对应关系。有关在源代码上执行的高级转换的更多信息,请访问–O3 –Otime 使用 –remarks 命令行选项。 -
因为优化会影响目标代码到源代码的映射,所以使用 -Ospace 和 -Otime 选择优化级别通常会影响调试视图。 -
如果需要简单的调试视图,选项 -O0 是最好的选择。选择 -O0 通常会将 ELF 映像的大小增加 7% 到 15%。要减小调试表的大小,请使用–remove_unneeded_entities 选项 -
–split_sections为每个源文件的函数创建一个section,方便在链接的时候去掉.o文件 中的不用的函数。–attribute((section(…))) 可以修饰data 和 function,将其放到指定的section,而不是放到默认的section -
–thumb将该.c文件编译成 thumb指令,
#pragma arm 编译成arm指令
#pragma thumb 编译成thumb指令
#pragam push 保存#pragma 状态
#pragma pop 弹出状态 与上面的可以一起使用
#pragma pack(n) 设置 n字节对齐,对于结构体来说。
12345
-
–use_frame_pointer这个设置栈顶指针,每次进入函数后,会首先将栈顶压入栈,之后再做其他的寄存器压栈,这样的好处是backtrace的调用关系很容易找出来。详见ARM开发中几个常见的寄存器详解 -
-apcs=interwork 支持内部thumb与arm 指令相互切换,比如BLX,这个支持thumb指令的地方用处较多,
2、armasm
-
嵌入式汇编
-
-
函数形参列表可以使用变量,但是函数体必须要用寄存器,函数体都是汇编语言实现 -
需要汇编语言处理返回指令
-
__asm return-type function-name(parameter-list)
{
// ARM/Thumb assembly code
instruction{;comment is optional}
...
instruction
}
/*示例1*/
__asm int f(int i)
{
ADD r0, r0, #1
}
/*示例2*/
#include
__asm void my_strcpy(const char *src, char *dst)
{
loop
LDRB r2, [r0], #1
STRB r2, [r1], #1
CMP r2, #0
BNE loop
BX lr
}
int main(void)
{
const char *a = "Hello world!";
char b[20];
my_strcpy (a, b);
printf("Original string: '%s'\n", a);
printf("Copied string: '%s'\n", b);
return 0;
}
-
内联汇编
-
-
同一行如果有多行指令,必须要有封号(;) -
如果一个指令超出一行,需要增加反斜杠(\) -
在多行格式中,允许在内联汇编语言块中的任何位置使用C和C++注释。但是注释不能嵌入到多条指令的行中。 -
在汇编语言中,逗号(,)用作分隔符,所以C表达式的逗号运算符必须用括号括起来来和它们进行区分 -
标签必须后跟冒号,:,如C和C++标签 -
asm语句必须位于C++函数内部。asm语句可以在任何需要C++语句的地方使用 -
内联程序集代码中的寄存器名被视为C或C++变量。它们不一定与同名的物理寄存器有关。如果寄存器未声明为C或C++变量,编译器将生成警告 -
不得在内联程序集代码中保存和还原寄存器,编译器会执行此操作。此外,内联汇编程序不提供对物理寄存器的直接访问。然而,可以通过变量间接访问寄存器 -
pc/lr/sp:__current_pc,__current_sp, and __return_address 来read -
内联汇编中不要修改处理器模式或者协处理器的状态
-
int f(int x)
{
__asm
{
STMFD sp!, {r0} // save r0 - illegal: read before write
ADD r0, x, 1
EOR x, r0, x
LDMFD sp!, {r0} // restore r0 - not needed.
}
return x;
}
The function must be written as:
int f(int x)
{
int r0;
__asm
{
ADD r0, x, 1
EOR x, r0, x
}
return x;
}
int foo(int x, int y)
{
__asm
{
SUBS x,x,y
BEQ end
}
return 1;
end:
return 0;
}
由于篇幅原因,后续再补充armclang的知识。
以上就是良许教程网为各位朋友分享的Linu系统相关内容。想要了解更多Linux相关知识记得关注公众号“良许Linux”,或扫描下方二维码进行关注,更多干货等着你 !