目录
一、什么是链接脚本?
一段程序的编译需要经历四个阶段(预处理—编译—汇编—链接),而链接脚本管理的就是其中的“链接”阶段。一段程序往往包含了变量、常量、数据(代码逻辑),他们属于不同的段:
- .bss段:一个全局变量,没有被初始化 或者 被初始化为0。
- .data段:一个全局变量,非const类型,已被初始化(初始值必须是非0值)
- .rodata段:read only data,如字符串常量、const修饰的变量都会被保存到该段
- .text段:程序代码段,更进一步讲是存放处理器的机器指令。函数代码逻辑都会保存到该段
链接脚本决定了一个可执行程序的各个段的存储位置,相当于要给程序中的数据和变量进行分类,并确定每一类的存放位置。
注意:实际涉及的段远不止这四个,这里只是列举了我们所熟知的段
二、链接脚本的基本语法格式
1、常用命令
命令 | 说明 | 举例 |
ENTRY(symbol) | 这里的symbol指的是符号表中的符号。汇编阶段会生成符号表,符号表中的符号包括静态变量、全局变量、函数名等。 这是将某一个符号symbol的值设为入口地址(进程执行的第一条用户空间指令就会从此处开始执行) | ENTRY(_start) |
OUTPUT_ARCH | 设置输出文件的目标平台架构 | OUTPUT_ARCH(arm) |
SECTIONS | 告诉链接器如何把输入文件映射到内存指定位置(即设置各个段的位置) | SECTIONS { ... } |
更多命令参考:lds文件命令
2、内置变量
.bss:表示bss段
.data:表示data段
.rodata:表示rodata段
.text:表示text段
. :定位器(暂不解释,下面示例说明的时候会更有体会)
三、链接脚本的简单案例
以下面这个链接脚本为例。冒号、等号的两边需要有空格,否则可能会在编译的时候报语法错误。
1、第 2 行
. 表示定位器,你可以理解为一个指针,此时指针指向的是 0x87800000 的位置。
2、第 4 - 8 行
.text 开头,说明这里要设置的是 text 段相关的内容了。每一个文件都可能存在 .text段、.data 段 相关的内容,* 是通配符,表示所有文件;*(.text) 表示每个文件与 .text 段相关的内容。
这里想表达的意思是,把 obj 下的 start.o 和 其他所有输入文件与 .text 段相关的内容统一保存到DDR的 .text 段。
3、第 9 行
如果这里没有 ALIGN(4),根据.text 的理解就是,所有输入文件和 .rodata 段相关的内容都保存到DDR的 .rodata 段。
ALIGN(4) 的作用是地址对齐,即DDR 的 .rodata 段的起始地址必须是 4 的整数倍。如果没有ALIGN(4),rodata段是紧跟在 .text 的后面的。(假设 .text 段的大小是 0x1001)
- .rodata :
- {
- *(.rodata)
- }
如果加了 ALIGN(4),此时 .rodata 的起始地址必须是 4 的整数倍。这么做的目的是提升内存访问效率,内存在访问该段的时候,没必要每个地址都去查,只要查 4 的整数倍的地址即可。
- // 也可以是 ALIGN(8)
- .rodata ALIGN(4) :
- {
- *(.rodata)
- }
4、第10 行
参考第 8 行的解析
5、第 11 - 14 行
__bss_start 和 __bss_end 并非内置变量,而是自定义符号,以便用于保存 bss 段的起始位置和结束地址。前面提到 . 表示定位器,即便我们中间没有去手动管理,它也会自动跟随我们的操作进行移动。第 13 行可以参考第 8 行的解析。
问:为什么需要保存 .bss 段的起始位置和结束位置?
答:
.bss 段是保存了被定义但是没有被初始化的变量,我们需要手动对 .bss 段的变量清零,为此我们就需要知道 .bss 段的起始位置和结束地址,以便于之后在 C文件或者汇编文件中直接引用。
问:第 11 行的 . = ALIGN 有什么用?
答:
后续我们可能在其他地方会使用符号 __bss_start 和 __bss_end,CPU 每次从内存取址都是一次拿4个字节,如果 __bss_start 不是 4 字节对齐,CPU 从 __bss_start 位置拿到的指令很有可能是残缺的。
因此,第 11 行在对定位器进行 4 字节对齐操作。
评论记录:
回复评论: