良许Linux教程网 干货合集 Keil 编译器AC6中的LLVM编译原理

Keil 编译器AC6中的LLVM编译原理

在Keil MDK中使用的是Arm编译器(Arm Compiler),目前主要有AC5和AC6两个版本。

相较于AC5,在编译速度上,AC6有很大的提升。你可能想知道这是为什么呢?

AC6之所以编译速度更快,是因为它是基于现代LLVM(Low-Level Virtual Machine)和Clang技术构建的。下面我们来详细讲解AC6和LLVM编译原理。

关于编译器AC6,早在2015年,Arm推出了AC6编译器,并将其集成在Keil MDK中。然而,由于AC5和AC6之间对代码的兼容性不友好,这导致仍有许多使用Keil MDK的用户选择AC5编译器。

尽管存在兼容性不佳的问题,但AC6的编译速度远远快于AC5,这吸引了一部分人开始使用AC6编译器。

那么,AC6为什么能够实现更快的编译速度呢?原因在于AC6采用了一套全新的架构技术。

AC6组件如下图:

image-20231123223317180
image-20231123223317180

1.armclang

  • 基于现代LLVM和Clang技术构建
  • 支持GNU语法汇编
  • 与最初为GCC编写的源代码高度兼容
  • 实现规范,包括ANSI / ISO C和C ++,用于Arm架构的ABI,用于64位Arm架构的ABI以及Arm C语言扩展(ACLE)

2.armlink

功能丰富的专用嵌入式链接器,该链接器将对象和库组合在一起以生成可执行文件

3.Arm C库:由Arm针对性能和代码密度进行了优化,并包括 用于深度嵌入式应用程序的微型MicroLib。

4.Arm C++库:基于LLVM libc ++项目的库

这部分内容可参看:

https://developer.arm.com/tools-and-software/embedded/arm-compiler

Keil MDK 编译器 AC5 和 AC6 优化选项重要内容有着很大区别:ARM Compiler 5(和更早版本)使用armcc编译器,而ARM Compiler 6将armcc替换为armclang,armclang基于LLVM,它具有不同的命令行参数、指令等,因此算是一个新的编译器。

这里推荐阅读:

手把手教你Keil MDK编译器从V5升级到V6

手把手教你升级Keil MDK的ARM编译器

手把手教你在Keil MDK中使用GCC编译器工具链

Keil MDK使用编译器AC5与AC6生成浏览信息的差异

LLVM基础内容

上面我们讲到了AC6是基于LLVM,下面就来讲讲关于LLVM的内容。

1.什么LLVM?

LLVM是构架编译器(compiler)的框架系统,以C++编写而成,用于优化以任意程序语言编写的程序的编译时间(compile-time)、链接时间(link-time)、运行时间(run-time)以及空闲时间(idle-time),对开发者保持开放,并兼容已有脚本。

在理解LLVM时,我们可以认为它包括了一个狭义的LLVM和一个广义的LLVM。广义的LLVM其实就是指整个LLVM编译器架构,包括了前端、后端、优化器、众多的库函数以及很多的模块;而狭义的LLVM其实就是聚焦于编译器后端功能(代码生成、代码优化、JIT等)的一系列模块和库。

2.LLVM优势

传统编译器分三个阶段:

前端(Frontend)– 优化器(Optimizer)– 后端(Backend)

前端负责分析源代码,可以检查语法级错误,并构建针对语言的抽象语法树(AST);抽象语法树可以进一步转换为优化,最终转为新的表示方式,然后再交给让优化器和后端处理;

最终由后端生成可执行的机器码。

image-20231123223310398
image-20231123223310398

llvm也分三个阶段,但是设计上略微的有些区别, LLVM不同的就是对于不同的语言它都提供了同一种中间表示:

image-20231123223308093
image-20231123223308093

前端可以使用不同的编译工具对代码文件做词法分析以形成抽象语法树AST,然后将分析好的代码转换成LLVM的中间表示IR(intermediate representation);中间部分的优化器只对中间表示IR操作,通过一系列的pass对IR做优化;后端负责将优化好的IR解释成对应平台的机器码。LLVM的优点在于,中间表示IR代码编写良好,而且不同的前端语言最终都转换成同一种的IR。

为什么使用三段式设计?优势在哪里?首先解决一个很大的问题:假如有N种语言(C、OC、C++、Swift…)的前端,同时也有M个架构(模拟器、arm64、x86…)的target,是否就需要N*M个编译器?三段式架构的价值就提现出来了,通过共享优化器的中转,很好的解决了这个问题。

Clang和LLVM关系

Clang是一个C++编写、基于LLVM、发布于LLVM BSD许可证下的C/C++/Objective-C/Objective-C++编译器。那么为什么已经有了GCC还要开发Clang呢?Clang相比于GCC有什么优势呢?

其实,这也是Clang当初在设计开发的时候所主要考虑的原因。Clang是一个高度模块化开发的轻量级编译器,它的编译速度快、占用内存小、非常方便进行二次开发。

LVM和Clang的关系是怎样的呢。我们将它们对应于传统的编译器当中的几个独立的部分,这样能够更加方便明确生动的表述。

image-20231123223303358
image-20231123223303358

其实,对应到这个图中,我们就可以非常明确的找出它们的对应关系。LLVM与Clang是C/C++编译器套件。对于整个LLVM的框架来说,包含了Clang,因为Clang是LLVM的框架的一部分,是它的一个C/C++的前端。Clang使用了LLVM中的一些功能,目前知道的就是针对中间格式代码的优化,或许还有一部分生成代码的功能。

从源代码角度来讲,clang是基于LLVM的一个工具。而功能的角度来说,LLVM可以认为是一个编译器的后端,而clang是一个编译器的前端,他们的关系更加的明了,一个编译器前端想要程序最终变成可执行文件,是缺少不了对编译器后端的介绍的。

LLVM编译工具链编译流程

使用LLVM的对一门语言编译的简图如下所示:

image-20231123223259790
image-20231123223259790

LLVM编译一个源文件的过程:预处理 -> 词法分析 -> Token -> 语法分析 -> AST -> 代码生成 -> LLVM IR -> 优化 -> 生成汇编代码 -> Link -> 目标文件.

完全需要我们手工,或者依靠其他工具如lex, yacc来做的事情,是从源代码到token的词法分析和从token到AST的语法分析;词法分析的输出是将源代码解析成一个个的token。这些token就是有类型和值的一些小单元,比如是关键字,还是数字,还是标识符,从AST转LLVM开始,LLVM就开始提供一系列的工具帮助我们快速开发。从IR(中间指令代码)到DAG(有向无环图)再到机器指令,针对常用的平台,LLVM有完善的后端。也就是说,我们只要完成了到IR这一步,后面的工作我们就享有和Clang一样的先进生产力了。

CodeGen负责将语法树从顶至下遍历,翻译成LLVM IR,LLVM IR是Frontend的输出,也是LLVM Backerend的输入,桥接前后端。

LLVM命令:

  • 可以使用 llc 将 LLVM 字节代码转换成特定于平台的汇编代码
  • lli 可以通过解释器或使用高级选项中的即时 (JIT) 编译器执行此工作
  • llvm-gcc 是 GNU Compiler Collection (gcc) 的修改版本,可以在使用 -S -emit-llvm 选项运行时会生成 LLVM 字节代码。

编译指令:

clang -c -emit-llvm test1.c -o test1.bc 编译产生字节码

clang -S -emit-llvm test.c -o test.ll 编译产生可视化字节码

llvm-dis test1.bc test1.ll bc字节码转为可视化字节码ll

llvm-as test1.ll test1.bc 可视化字节码转为字节码bc

以上就是良许教程网为各位朋友分享的Linu系统相关内容。想要了解更多Linux相关知识记得关注公众号“良许Linux”,或扫描下方二维码进行关注,更多干货等着你 !

137e00002230ad9f26e78-265x300
本文由 良许Linux教程网 发布,可自由转载、引用,但需署名作者且注明文章出处。如转载至微信公众号,请在文末添加作者公众号二维码。
良许

作者: 良许

良许,世界500强企业Linux开发工程师,公众号【良许Linux】的作者,全网拥有超30W粉丝。个人标签:创业者,CSDN学院讲师,副业达人,流量玩家,摄影爱好者。
上一篇
下一篇

发表评论

联系我们

联系我们

公众号:良许Linux

在线咨询: QQ交谈

邮箱: yychuyu@163.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部