elf文件中.bss段:
存放未初始化的全局变量,将.data和.bss分开的理由是为了节约磁盘空间,.bss不占实际的磁盘空间。这句话该怎么理解呢?
可以看下面的例子:
#include
int a[1000];
int b[1000] = {1};
int main()
{
printf("123\n");
return 0;
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
这里编写了一个test.c
的文件,gcc编译gcc test.c -o test
之后,使用ls -l test
命令可以得到可执行文件的信息,我们只关注文件的大小为12608。
使用命令size test
查看各个段的大小(不包含stack和heap段):
接着我们修改源程序:
#include
int a[1000] = {1};
int b[1000] = {1};
int main()
{
printf("123\n");
return 0;
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
编译之后,使用ls -l test
命令再次查看可执行文件的信息:
使用命令size test
查看段的大小:
可以看到大小从12608变成了16608,与之前相对比,该文件占据的大小涨了4000字节,这不就是我们的数组a[1000]
的大小吗?我们所在的改动仅仅是初始化了a[1000]
,让这个数组的所在段从.bss
段改到了.data
段。通过size test
命令查看bss
段的大小也减小了。这就证明了.bss
段中的数据并没有占据磁盘空间,从而节约了磁盘的空间。
当程序加载运行时,就会为.bss
段中的数据分配内存已经进行初始化了。
下面还有两个疑问,那就是int a[1000]
既然不占据实际的磁盘空间(是指不占据应该分配的内存大小),那么它的大小和符号存在哪呢?
.bss
段占据的大小存放在ELF文件格式中的段表(Section Table)中,段表存放了各个段的各种信息,比如段的名字、段的类型、段在elf文件中的偏移、段的大小等信息。
我们可以通过命令readelf -S test
来查看test
可执行文件的段表(这里只截取了一部分):
这里再额外说明一个很有趣的地方,在elf文件结构中,有一个字符串表.strtab
,里面存放的是elf文件中各个段的名字以及变量名等字符串,字符串表中记录了这些字符串以及对应的下标,需要用到这些字符串时,直接用偏移下标去取就行了。段表中存放的段的名字这一项,就是存的.strtab
中对应字符串的偏移。
.bss
段所占空间的大小存在哪里解决了,那么就剩下符号了。
符号当然对应的存在符号表.symtab
中了。
我们可以通过命令readelf -s test
来查看:
在第49行,我们看到了定义的全局数组b[1000]
,4000
那一项表明数据的大小是4000
字节,OBJECT
代表是一个变量,GLOBAL
代表是作用域是全局的。
最后我们总结一下:
.bss
不占据实际的磁盘空间,只在段表中记录大小,在符号表中记录符号。当文件加载运行时,才分配空间以及初始化。
评论记录:
回复评论: