GCC 指令详解及动态库、静态库的使用

乎语百科 2022-10-29 20:10:19 457 0

GCC 指令详解及动态库、静态库的使用

一、GCC

1.1 GCC 介绍

GCC 是 Linux 下的编译工具集，是「GNU Compiler Collection」的缩写，包含 gcc、g++ 等编译器。这个工具集不仅包含编译器，还包含其他工具集，例如 ar、nm 等。

GCC 工具集不仅能编译 C/C++ 语言，其他例如 Objective-C、Pascal、Fortran、Java、Ada 等语言均能进行编译。GCC 还可以根据不同的硬件平台进行编译，即能进行交叉编译，在 A 平台上编译 B 平台的程序，支持常见的 X86、ARM、PowerPC、mips 等，以及 Linux、Windows 等软件平台。

1.2 安装 GCC

首先，查看 gcc 是否安装：

# 查看 gcc 版本
$ gcc -v
$ gcc --version

# 查看 g++ 版本
$ g++ -v
$ g++ --version

如果在输入指令后可以获取到 gcc 版本，那么就表明你的 Linux 中已经安装了 gcc： GCC 指令详解及动态库、静态库的使用

如果没有安装，则可按照如下方法安装 gcc：

# centos
$ sudo yum update   		# 更新本地的软件下载列表, 得到最新的下载地址
$ sudo yum install gcc g++	# 通过下载列表中提供的地址下载安装包, 并安装

1.3 GCC 工作流程

1.3.1 一般使用流程

首先准备一个 C 语言代码，并命名为 test.c：

#include <stdio.h>
#define MAX 3

int main()
{
    int i;
    for (i = 1; i <= MAX; i++)
    {
        printf("Hello World\n"); // 输出 Hello World
    }

    return 0;
}

一般情况下，我们可以直接通过 $ gcc test.c -o test编译 test.c，并通过$ ./test指令运行生成的可执行文件： GCC 指令详解及动态库、静态库的使用

-o：output，是 gcc 编译器的可选参数，用于指定输出文件名及路径，默认输出到当前路径下。下图展示了如何通过 -o 参数修改输出路径：

或者不使用 -o 参数，则生成一个默认名称的可执行文件 a.out： GCC 指令详解及动态库、静态库的使用

实际上，GCC 编译器在对程序进行编译的时候，分为了四个步骤：

预处理（Pre-Processing）：
- 在这个阶段主要做了三件事：展开头文件、宏替换、去掉注释行
- 结果得到的还是一个 C 程序，通常是以 .i 作为文件扩展名
编译（Compiling）：
- 在这个阶段中，gcc 首先要检查代码的规范性、是否有语法错误等，以确定代码实际要做的工作
- 在检查无误后，gcc 把代码编译成汇编代码，得到一个以 .s 作为文件拓展名的汇编文件。

汇编（Assembling）：

+ 汇编阶段是把编译阶段生成的 .s 文件转化成目标文件
+ 最终得到一个以 .o 结尾的二进制文件

链接（Linking）：这个阶段需要 GCC 调用链接器对程序需要调用的库进行链接，最终得到一个可执行的二进制文件

而 GCC 的编译器可以将这 4 个步骤合并成一个，这也就是为什么我们使用$ gcc test.c -o test就可以直接生成可执行文件 test 的原因。下面我们对这 4 个步骤做个详细的介绍。

1.3.2 详细的工作流程

1.3.2.1 预处理

# 通过添加参数 -E 生成预处理后的 C 文件 test.i
# 必须通过 -o 参数指定输出的文件名
$ gcc -E test.c -o test.i

让我们来观察一下 test.i 中的代码内容（太长了，只观察 main 函数中的替换情况）：

int main()
{
    int i;
    for (i = 1; i <= 3; i++)
    {
        printf("Hello World\n");
    }

    return 0;
}

通过分析 test.i 可以发现：

宏定义 MAX 被替换为了相应的值 3
注释「// 输出 Hello World」也被去掉了

1.3.2.2 编译

# 通过添加参数 -S 将 test.i 转换为汇编文件 test.s（默认生成 .s 文件）
$ gcc -S test.i
$ gcc -S test.i -o test.s # 写法二

1.3.2.3 汇编

# 通过汇编得到二进制文件 test.o（默认生成 .o 文件，object）
$ gcc -c test.s
$ gcc -c test.s -o test.o # 写法二

1.3.2.4 链接

# 通过链接得到可执行文件 test
$ gcc test.o -o test

在成功生成 test.o 文件后，就进入了链接阶段。在这里涉及到一个重要的概念：函数库。

在 test.c 的代码中，我们通过print()函数打印 Hello World 语句；但是在这段程序中并没有定义 printf 的函数实现，且在预编译中包含进去的「stdio.h」中也只有该函数的声明extern int printf (const char *__restrict __format, ...);，而没有定义函数的实现，那么是在哪里实现的呢？

答案就是：系统把这些函数实现都做到了名为 libc.so.6 的库文件中去了，在没有特别指定时，gcc 会到系统默认的搜索路径 /usr/lib64 下进行查找，也就是链接到 libc.so.6 库函数中去，这样就有函数 printf 的实现了，而这也就是链接的作用。

GCC 指令详解及动态库、静态库的使用

而函数库一般分为静态库和动态库两种：

静态库是指在编译链接时，把库文件的代码全部加入到可执行文件中，因此生成的文件比较大，但在运行时也就不需要库文件了。在 Linux 中静态库一般以 .a 作为后缀。
动态库与之相反，在编译链接时并没有把库文件的代码加入到可执行文件中，而是在程序执行时链接文件加载库，这样就可以节省系统的开销。在 Linux 中动态库一般以 .so 作为后缀。

如前面所述的 libc.so.6 就是动态库，gcc 在编译时默认使用动态库。完成了链接之后，gcc 就可以生成可执行文件了。

有关动态库和静态库的详细介绍，将在下文进行具体讲解。

1.3.2.5 总结

最后，通过一张图来总结一下上述流程： GCC 指令详解及动态库、静态库的使用

在 Linux 下使用 GCC 编译器编译单个文件十分简单，直接使用$ gcc test.c（test.c 为要编译的 C 语言的源文件），GCC 会自动生成文件名为 a.out 的可执行文件（也可以通过参数 -o 指定生成的文件名）；也就是通过一个简单的命令就可以将上边提到的 4 个步骤全部执行完毕了；但是如果想要单步执行也是没问题的。

1.4 GCC 常用参数

下面的表格中列出了一些常用的 gcc 参数，这些参数在 gcc 命令中没有位置要求，只需要编译程序的时候将需要的参数指定出来即可。

gcc 编译选项	解释说明
-E	预处理，主要是进行宏展开等步骤，生成 test.i
-S	编译指定的源文件，但是不进行汇编，生成 test.s
-c	编译、汇编源文件，但是不进行链接，生成 test.o
-o	指定链接的文件名及路径
-g	在编译的时候，生成调试信息，该程序可以被调试器调试
-D	在程序编译的时候，指定一个宏
-std	指定 C 方言，如 -std=c99。gcc 默认的方言是 GNU C
-l	在程序编译的时候，指定使用的库（库的名字一定要掐头去尾，如 libtest.so 变为 test）
-L	在程序编译的时候，指定使用的库的路径
-fpic	生成与位置无关的代码
-shared	生成共享目标文件，通常用在建立动态库时

1.4.1 指定一个宏（-D）

在程序中我们可以通过使用#define定义一个宏，也可以通过宏控制某段代码是否能够被执行。

#include <stdio.h>

int main()
{
    int num = 60;
    printf("num = %d\n", num);
#ifdef DEBUG
    printf("定义了 DEBUG 宏, num++\n");
    num++;
#else
    printf("未定义 DEBUG 宏, num--\n");
    num--;
#endif

    printf("num = %d\n", num);

    return 0;
}

由于我们在程序中并没有定义 DEBUG 宏，所以第 8~9 行的代码就不会被执行： GCC 指令详解及动态库、静态库的使用

那么如何才能够在程序中不定义 DEBUG 宏的情况下执行第 8~9 行的代码呢？答案是通过 -D 参数： GCC 指令详解及动态库、静态库的使用

需要注意的是，-D 参数必须在生成 test.o 前使用（链接前）。如下所示，是无效的： GCC 指令详解及动态库、静态库的使用

说了这么多，-D 参数有什么用呢？下面我们简单叙述一下 -D 参数的应用场景。

1.4.1.1 应用场景一

在发布程序的时候，一般都会要求将程序中所有的 log 输出去掉，如果不去掉会影响程序的执行效率，很显然删除这些打印 log 的源代码是一件很麻烦的事情，解决方案是这样的：

将所有的打印 log 的代码都写到一个宏判定中，可以模仿上边的例子；
在调试程序的时候指定 -D，就会有 log 输出；
在发布程序的时候不指定 -D，log 就不会输出；

1.4.1.2 应用场景二

或者，你编写的一个软件，某个付费功能只对已付费的用户 A 开放，但不对白嫖的用户 B 开放，其中一种解决方法是：

每个用户对应一个维护分支，用户 A 对应 project_1 分支包含付费功能的代码，用户 B 对应的 project_2 分支不包含付费功能的代码。
当用户 B 付费订阅时，再将付费项目的代码拷贝到 project_2 中

如果再来一个用户 C 呢？有没有感觉很麻烦的样子？那么我们完全可以这样做：

#include <stdio.h>

int main()
{
#ifdef CHARGE
    //付费用户执行流程
    printf("该用户已付费，执行付费功\n");
#else
    //白嫖用户执行流程
    printf("白嫖用户，拒绝执行付费功能\n");
#endif

    printf("公共功能\n");

    return 0;
}

在编译付费用户的时候，添加 -D CHARGE 参数；编译白嫖用户，则不添加。这样的话，不管来多少用户，都只需要维护一个分支即可。

1.4.2 指定 C 方言（-std）

对于如下 C 语言代码：

#include <stdio.h>

int main()
{
    for (int i = 1; i <= 3; i++)
    {
        printf("i = %d\n", i);
    }

    return 0;
}

在编译时是会报错的： GCC 指令详解及动态库、静态库的使用

但如果我们加上 -std=c99，就可以了： GCC 指令详解及动态库、静态库的使用

二、静态库和动态库

2.1 扫盲

库是「已经写好的、供使用的」可复用代码，每个程序都要依赖很多基础的底层库。

从本质上，库是一种可执行代码的二进制形式，可以被操作系统载入内存执行。程序中调用的库有两种「静态库和动态库」，所谓的「静态、动态」指的是链接的过程。

2.2 静态库

2.2.1 静态库简介

在 Linux 中静态库以 lib 作为前缀、以 .a 作为后缀，形如 libxxx.a（其中的 xxx 是库的名字，自己指定即可）。静态库以之所以称之为「静态库」，是因为在链接阶段，会将汇编生成的目标文件 .o 与引用的库一起链接到可执行文件中，对应的链接方式称为静态链接。

2.2.2 静态库的生成

在 Linux 中静态库由程序 ar 生成。生成静态库，需要先对源文件进行汇编操作得到二进制格式的目标文件（以 .o 结尾的文件），然后再通过 ar 工具将目标文件打包就可以得到静态库文件了。

GCC 指令详解及动态库、静态库的使用

使用 ar 工具创建静态库的一般格式为$ ar -rcs libxxx.a 若干原材料(.o文件)：

2.2.3 静态库的制作举例

在某目录中有如下源文件，用来实现一个简单的计算器。

add.c

#include <stdio.h>

int add(int a, int b)
{
    return a + b;
}

sub.c

#include <stdio.h>

int subtract(int a, int b)
{
    return a - b;
}

mult.c

#include <stdio.h>

int multiply(int a, int b)
{
    return a * b;
}

具体操作步骤如下：

# 第一步：将源文件 add.c、sub.c、mult.c 进行汇编，得到二进制目标文件 add.o、sub.o、mult.o
$ gcc -c add.c sub.c mult.c

# 第二步：将生成的目标文件通过 ar 工具打包生成静态库
$ ar rcs libcalc.a add.o sub.o mult.o

2.2.4 静态库的使用

定义 main 函数如下所示：

main.c

#include <stdio.h>

int main()
{
    int a = 20;
    int b = 12;

    printf("a = %d, b = %d\n", a, b);
    printf("a + b = %d\n", add(a, b));
    printf("a - b = %d\n", subtract(a, b));
    printf("a * b = %d\n", multiply(a, b));

    return 0;
}

并将静态库 libcalc.a 置于同级目录下：

GCC 指令详解及动态库、静态库的使用

通过指令$ gcc main.c -o main -L ./ -l calc编译 main.c 文件，并链接静态库 libcalc.a：

-L：指定使用的库的路径（因为在同一级目录下，所以可以直接用了./，或者使用绝对路径也是可以的）
-l：指定使用的库（库的名字一定要掐头去尾。如：libcalc.a 变为 calc）

编译结果会提示三个 warning，这是由于没有定义这些函数导致的，先暂时不用管。

运行 main 结果如下：

GCC 指令详解及动态库、静态库的使用

我们思考这么一个问题：由于静态库是我们自己制作的，其所包含的函数我们很清楚，直接链接并使用即可。但如果别人想要使用呢？他们可不清楚静态库中的函数该如何调用，所以我们有必要提供一个头文件，这样将静态库及头文件交给其他人时，他们知道该如何用了。

head.h

#ifndef _HEAD_H_
#define _HEAD_H_

int add(int a, int b);

int subtract(int a, int b);

int multiply(int a, int b);

#endif

还记得之前的报错吗？现在有了头文件就要使用起来。

main.c

#include <stdio.h>
#include "head.h"

int main()
{
    int a = 20;
    int b = 12;

    printf("a = %d, b = %d\n", a, b);
    printf("a + b = %d\n", add(a, b));
    printf("a - b = %d\n", subtract(a, b));
    printf("a * b = %d\n", multiply(a, b));

    return 0;
}

编译、链接、运行，一气呵成：

GCC 指令详解及动态库、静态库的使用

2.2.5 ar 命令参数介绍

制作静态库时所使用的指令$ ar rcs libcalc.a add.o sub.o mult.o div.o共有三个参数：

-c：创建一个库，不管库是否存在，都将创建。这个很好理解，就不做过多的解释了。
-r：在库中插入（替换）模块。默认新的成员添加在库的结尾处，如果模块名已经在库中存在，则替换同名的模块。
-s：创建目标文件索引，这在创建较大的库时能加快时间。

参数 -r 的详细解释

假设现在有了新的需求，需要静态库 libcalc.a 提供除法运算的功能模块，该怎么操作呢？

首先我们需要新建一个除法运算的源文件 div.c：

#include <stdio.h>

double divide(int a, int b)
{
    return (double)a / b;
}

并通过汇编操作生成目标文件 div.o。

接下来我们可以通过 -r 参数将除法运算的模块添加到静态库中：$ ar -r libcalc.a div.o。

并且要在 head.h 中增加对除法运算的声明：

#ifndef _HEAD_H_
#define _HEAD_H_

// Other

double divide(int a, int b);

#endif

参数 -s 的详细解释

在获取一个静态库的时候，我们可以通过$ nm -s libcalc.a来显示库文件中的索引表： GCC 指令详解及动态库、静态库的使用

而索引的生成就要归功于 -s 参数了。

如果不需要创建索引，可改成 -S 参数。

如果 libcalc.a 缺少索引，可以使用$ ranlib libcalc.a 指令添加。

2.2.6 其他命令介绍

# 显示库文件中有哪些目标文件，只显示名称
$ ar t libcalc.a

# 显示库文件中有哪些目标文件，显示文件名、时间、大小等详细信息
$ ar tv libcalc.a

# 显示库文件中的索引表
$ nm -s libcalc.a

# 为库文件创建索引表
$ ranlib libcalc.a

2.3 动态库

2.3.1 动态库简介

在 Linux 中动态库以 lib 作为前缀、以 .so 作为后缀，形如 libxxx.so（其中的 xxx 是库的名字，自己指定即可）。相比于静态库，使用动态库的程序，在程序编译时并不会链接到目标代码中，而是在运行时才被载入。不同的应用程序如果调用相同的库，那么在内存中只需要有一份该共享库的实例，避免了空间浪费问题。同时也解决了静态库对程序的更新的依赖，用户只需更新动态库即可。

2.3.2 动态库的生成

生成动态库是直接使用 gcc 命令，并且需要添加 -fpic 以及 -shared 参数：

-fpic 参数的作用是使得 gcc 生成的代码是与位置无关的，也就是使用相对位置。
-shared 参数的作用是告诉编译器生成一个动态链接库。

GCC 指令详解及动态库、静态库的使用

2.3.3 动态库的制作举例

还是以上述程序 add.c、sub.c、mult.c 为例：

# 第一步：将源文件 add.c、sub.c、mult.c 进行汇编，得到二进制目标文件 add.o、sub.o、mult.o
$ gcc -c -fpic add.c sub.c mult.c

# 第二步：将得到的 .o 文件打包成动态库
$ gcc -shared add.o sub.o mult.o -o libcalc.so

# 第三步：发布动态库和头文件
1. 提供头文件 head.h
2. 提供动态库 libcalc.so

至于为什么需要提供头文件，在讲解静态库时已经做了说明，此处不再赘述。

2.3.4 动态库的使用

head.h

#ifndef _HEAD_H_
#define _HEAD_H_

int add(int a, int b);

int subtract(int a, int b);

int multiply(int a, int b);

#endif

main.c

#include <stdio.h>
#include "head.h"

int main()
{
    int a = 20;
    int b = 12;

    printf("a = %d, b = %d\n", a, b);
    printf("a + b = %d\n", add(a, b));
    printf("a - b = %d\n", subtract(a, b));
    printf("a * b = %d\n", multiply(a, b));

    return 0;
}

和静态库的链接方式一样，都是通过指令$ gcc main.c -o main -L ./ -l calc来进行链接库操作。

gcc 通过指定的动态库信息生成了可执行程序 main，但是可执行程序运行却提示无法加载到动态库：

./main: error while loading shared libraries: libcalc.so: cannot open shared object file: No such file or directory

这是怎么回事呢？

2.3.5 解决动态库加载失败的问题

首先来看一下不同库的工作原理：

静态库如何被加载：
- 在程序编译的最后一个阶段也就是链接阶段，提供的静态库会被打包到可执行程序中。
- 当可执行程序被执行，静态库中的代码也会一并被加载到内存中，因此不会出现静态库找不到无法被加载的问题。
动态库如何被加载：
- 在程序编译的最后一个阶段也就是链接阶段，在 gcc 命令中虽然指定了库路径，但是这个路径并没有被记录到可执行程序中，只是检查了这个路径下的库文件是否存在。同样对应的动态库文件也没有被打包到可执行程序中，只是在可执行程序中记录了库的名字。
- 当可执行程序被执行起来之后：
  - 程序会先检测所需的动态库是否可以被加载，加载不到就会提示上边的错误信息。
  - 当动态库中的函数在程序中被调用了，这个时候动态库才加载到内存，如果不被调用就不加载。

动态库的检测和内存加载操作都是由动态链接器来完成的

动态链接器是一个独立于应用程序的进程，属于操作系统。当用户的程序需要加载动态库的时候动态连接器就开始工作了，很显然动态连接器根本就不知道用户通过 gcc 编译程序的时候通过参数 -L 指定的路径。

那么动态链接器是如何搜索某一个动态库的呢，在它内部有一个默认的搜索顺序，按照优先级从高到低的顺序分别是：

可执行文件内部的 DT_RPATH 段。
系统的环境变量 LD_LIBRARY_PATH。
系统动态库的缓存文件 /etc/ld.so.cache。
存储「静态库 / 动态库」的系统目录 /lib、/usr/lib 等。

按照以上四个顺序，依次搜索，找到之后结束遍历。若检索到最终还是没找到，那么动态连接器就会提示动态库找不到的错误信息。一般情况下，我们都是通过修改系统的环境变量的方式设置动态库的地址。

将动态库路径追加到环境变量 LD_LIBRARY_PATH 中：$ LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:动态库的绝对路径

比如，我所需要的动态库的绝对路径为 /mnt/hgfs/SharedFolders/DynamicLibrary，那么：

$ LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/mnt/hgfs/SharedFolders/DynamicLibrary

这样的话，我在运行 main，就不会报错了。

但是通过这种方式设置的环境变量尽在当前的终端中有效，那么怎样才能让这个设置永久生效呢？

通过指令$ vim ~/.bashrc打开并修改该文件： GCC 指令详解及动态库、静态库的使用

修改后，使用$ source ~/.bashrc使修改立即生效。

经过上述操作，就不用每次开启终端都需要修改环境变量了。当然这种永久生效的方式仅适用于动态库路径唯一的情况，如果你每次使用的动态库都在不同的位置，那么这么设置也没啥用

2.4 动态库与静态库的比较

2.4.1 静态库的特点

静态库对函数库的链接是在编译期完成的。
静态库在程序编译时会链接到目标代码中，因此使可执行文件变大。
当链接好静态库后，在程序运行时就不需要静态库了。
对程序的更新、部署与发布不方便，需要全量更新。
如果某一个静态库更新了，所有使用它的应用程序都需要重新编译、发布给用户。

2.4.2 动态库的特点

动态库把对一些库函数的链接载入推迟到程序运行时期。
可以实现进程之间的资源共享，因此动态库也称为共享库。
将一些程序升级变得简单，不需要重新编译，属于增量更新。

2.5 使用库的目的

在项目中使用库一般有两个目的：

为了使程序更加简洁不需要在项目中维护太多的源文件。
另一方面是为了源代码保密，毕竟不是所有人都想把自己编写的程序开源出来。

当我们拿到了库文件（动态库、静态库）之后要想使用还必须有这些库中提供的 API 函数的声明，也就是头文件，把这些都添加到项目中，就可以快乐的写代码了。

参考资料

标签：