2023-06-04 2ee97b9cb0a47854794dcc6c6ab85f3b 99+ 10 分钟 1.5 k0次访问

常见的编译库和编译工具

常见的编译库与编译工具的介绍以及使用场景

1. 编译器 (Compiler)

代码的“翻译官”。将 C/C++ 代码翻译成机器能懂的汇编代码或目标文件 (.o)。
典型代表：GCC, Clang。
使用场景：写任何代码并想让它运行时，第一步就是用编译器进行翻译。

2. 工具链 (Toolchain)

一个完整的“工具箱”。编译器是工具链的核心组件之一**。工具链还包含了链接器 (ld)、汇编器 (as) 等，它们协同工作，将代码和库文件打包成最终的可执行文件。
使用场景：
- 本地工具链：编译在本机运行的程序 (e.g., gcc)。
- 交叉工具链：在一种架构（如x86电脑）上，编译给另一种架构（如RISC-V开发板）运行的程序 (e.g., riscv64-linux-gnu-gcc)。

3. libc (C标准库)

一个API标准或规范，不是一个具体的软件。它定义了像 printf, malloc 等基础函数。它是所有C程序的基础依赖。你需要一个具体的实现来使用它。
使用场景：这是一个抽象概念，你写的每一行C代码，只要调用了标准函数，都在与这个“标准”打交道。

4. glibc (GNU C Library)

libc 的一种强大、功能全面的实现**。它是为 Linux 操作系统设计的 libc。它不仅包含标准C函数，还包含大量与Linux内核交互的接口（如进程、网络功能）。
使用场景：当你需要开发一个运行在标准Linux系统（如Ubuntu/Debian/CentOS）上的应用程序时，你的程序会链接 glibc。对应的工具链通常叫 ...-linux-gnu-gcc。

5. newlib

libc 的一种轻量级、精简的实现**。它是为没有操作系统的环境设计的。因此，它没有 fork 等需要OS支持的复杂功能。
使用场景：开发裸机 (Bare-metal) 程序、固件 (Firmware)、Bootloader，或者在简单的实时操作系统 (RTOS) 上开发。对应的工具链通常叫 ...-elf-gcc。

6. GNU

一个庞大的自由软件生态系统。上面讨论的大部分经典工具都来自GNU项目，包括 GCC (编译器), glibc (C库), GDB (调试器), Make (构建工具)。”GNU Toolchain” 指的就是这一整套工具。
使用场景：Linux 和嵌入式开发的事实标准。

8. ELF (Executable and Linkable Format)

一种文件格式，像 .doc 或 .pdf 一样。它是工具链最终生成的产品。无论是裸机程序还是Linux程序，最终都可以打包成 ELF 格式。
使用场景：
- 裸机ELF：内部不依赖 glibc，直接在硬件上跑。
- Linux ELF：内部依赖 glibc 和Linux内核，必须在Linux系统上跑。
关键：决定它在哪跑的，是它内部链接了什么库，而不是 ELF 这个格式本身。

JIT:(即时编译，Just-In-Time compilation): 动态编译技术，它介于解释执行和提前编译（AOT, Ahead-Of-Time）之间。

解释执行：代码一行行解释运行（如 Python、早期 JavaScript），启动快，但运行慢。
提前编译（AOT）：代码在运行前全部编译成目标机器码（如 C/C++），运行快，但灵活性差。
JIT：在运行时，把中间表示（IR, bytecode）翻译成机器码，并缓存起来，下次直接运行机器码。既能接近原生性能，又保留了灵活性。
JIT 的本质过程：程序一开始以字节码（或中间表示）形式运行。运行过程中，JIT 编译器发现“这段代码执行得很频繁”（热点代码），于是触发编译。把字节码即时翻译成当前 CPU 架构的机器码（x86、ARM、RISC-V 等）。后续直接执行机器码（免去解释器逐条解释的开销）。

Clang/LLVM:

Clang：C/C++ 前端（把 C/C++/Objective-C 源转成通用的标准化的中间语言LLVM IR）。
- 词法分析：把代码拆成一个个单词（token），比如 int, main, (, ), {, }。
- 语法分析：检查这些单词组合起来是否符合 C/C++ 的语法规则。如果写了 int main{) 这种错误，Clang 就在这一步报错。
- 生成中间表示 (IR)：如果语法正确，Clang 会把代码转换成一种通用的、与具体计算机架构无关的格式，这就是 LLVM Intermediate Representation (LLVM IR)。
LLVM：编译器后台/工具链，接收Clang生成的LLVM IR, 进行一系列加工，生成可执行的机器码。
- 优化 (Optimization)：LLVM 会对 IR 进行大量的优化。比如删除无用的代码、合并重复的计算、展开循环等等，让最终的程序跑得更快、体积更小。这是 LLVM 的核心优势之一。
- 代码生成 (Code Generation)：这是最关键的一步。LLVM 会根据你指定的 “目标平台 (Target)”，将优化后的 IR 翻译成该平台专属的机器指令。
可移植性：Clang/LLVM 支持很多后端/目标（x86/arm/bpf 等）。当你用 -target bpf 时，Clang 输出的是 eBPF 字节码（虚拟指令），不是 x86 或 arm 机器码。这个字节码理论上可以在任何支持 eBPF 的内核上运行（但内核版本/ABI 细节会影响，CO-RE/BTF 出现就是为了解决这类兼容性问题）。最终在内核里，JIT 会把字节码翻译成当前 CPU 的本地机器码。

常见的编译库和编译工具

https://goko-son626.github.io/post/Compilation-libraries-and-tools.html

作者

GoKo Mell

发布于

2023-06-04

更新于

2025-10-31

常见的编译库和编译工具

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

链接

最新文章

分类

归档

标签