GNU汇编¶

gcc编译流程¶

以一个简单的c语言程序为例：

test.c

#include <stdio.h>

int data = 10;
int main(void)
{
    printf("%d\n",data);
    return 0;
}

gcc编译流程包括以下四个步骤：

预处理：gcc - E test.c -o test.i
编译：gcc -S test.i -o test.s
汇编：as test.s -o test.o
链接：ld test.o -o test -lc

汇编阶段生成的 .o 可重定位文件以及链接阶段生成的可执行文件都是 ELF 文件格式的一种。

ELF 文件主要包含：

ELF header：描述整个文件的基本属性
program header table：描述如何创建一个进程的内存映像
各个段
section header table：描述段的信息

readelf命令可以用来查看一个ELF文件的组成。比如readelf -h用来读取ELF header，readelf -S用来读取 section header table。

链接器¶

在现代软件工程中，一个大的项目往往由多个源文件组成，这些源文件经过预处理、编译、汇编后生成 .o 文件，然后通过链接器将这些 .o 文件链接成一个可执行文件。而链接脚本就告诉了链接器如何将目标文件组合起来。

以下是一段链接脚本的示例：

u-boot.lds

#include <config.h>
#include <asm/psci.h>

OUTPUT_FORMAT("elf64-littleaarch64", "elf64-littleaarch64", "elf64-littleaarch64")
OUTPUT_ARCH(aarch64)
ENTRY(_start)
SECTIONS
{
    . = 0x00000000;

    . = ALIGN(8);
    .text :
    {
        *(.__image_copy_start)
        CPUDIR/start.o (.text*)
    }

    /* This needs to come before *(.text*) */
    .efi_runtime : {
                __efi_runtime_start = .;
        *(.text.efi_runtime*)
        *(.rodata.efi_runtime*)
        *(.data.efi_runtime*)
                __efi_runtime_stop = .;
    }

    .text_rest :
    {
        *(.text*)
    }

    . = ALIGN(8);
    .rodata : { *(SORT_BY_ALIGNMENT(SORT_BY_NAME(.rodata*))) }

    . = ALIGN(8);
    .data : {
        *(.data*)
    }

    . = ALIGN(8);

    . = .;

    . = ALIGN(8);
    __u_boot_list : {
        KEEP(*(SORT(__u_boot_list*)));
    }

    . = ALIGN(8);

    .efi_runtime_rel : {
                __efi_runtime_rel_start = .;
        *(.rel*.efi_runtime)
        *(.rel*.efi_runtime.*)
                __efi_runtime_rel_stop = .;
    }

    . = ALIGN(8);

    .image_copy_end :
    {
        *(.__image_copy_end)
    }

    . = ALIGN(8);

    .rel_dyn_start :
    {
        *(.__rel_dyn_start)
    }

    .rela.dyn : {
        *(.rela*)
    }

    .rel_dyn_end :
    {
        *(.__rel_dyn_end)
    }

    _end = .;

    . = ALIGN(8);

    .bss_start : {
        KEEP(*(.__bss_start));
    }

    .bss : {
        *(.bss*)
         . = ALIGN(8);
    }

    .bss_end : {
        KEEP(*(.__bss_end));
    }

    /DISCARD/ : { *(.dynsym) }
    /DISCARD/ : { *(.dynstr*) }
    /DISCARD/ : { *(.dynamic*) }
    /DISCARD/ : { *(.plt*) }
    /DISCARD/ : { *(.interp*) }
    /DISCARD/ : { *(.gnu*) }
}

该链接脚本主要做了几件事：

指明输出二进制文件的格式和架构
指明程序的入口点为_start
设置程序的各个段，指明对齐方式
丢弃一些不必要的段

伪指令¶

伪指令在汇编期间由汇编器处理，可以实现多种功能。

一些常用的伪指令比如：

对齐伪指令：.align
数据定义伪指令：.byte，.word
函数控制伪指令：.global，.ifeq expression
段伪指令：.section
宏伪指令：.macro

GCC内联汇编¶

使用内联汇编，可以直接在C代码中编写汇编代码，并在编译时由GCC编译器进行处理。它的语法格式如下：

__asm__ asm-qualifiers(Assembler Template)
    : output operands
    : input operands
    : clobbers

__asm__：表示这是一个内联汇编代码。
asm-qualifiers：一般使用 volatile，表示编译器不要优化这段代码。
Assembler Template：汇编指令，用""包含，每条指令用\n分隔。

output operands：输出操作数，保存输出的结果，格式如下，当有多个变量时，用逗号隔开：

[[asmSymbolicName]] constraint (variablename)

asmSymbolicName：汇编符号名，用于引用输出结果，可写可不写
constraint：约束条件，有以下取值

constraint	说明
m	memory operand，表示要传入有效的地址
r	register operand，使用寄存器来保存操作数
i	immediate interger operand，表示可以传入一个立即数

constraint还可以加上一些修饰字符，比如"=r"、"+r"、"=&r"，含义如下：

修饰	说明
=	表示内联汇编会修改这个操作数，即写
+	既被读，也被写
&	earlyclobber操作数

示例1：

[result] "=r"(sum)

表示汇编代码通过某个寄存器把结果写入sum变量，可以用"%[result]"来引用

input operands：输入操作数，用于传入参数，格式如下，当有多个变量时，用逗号隔开：
```
[[asmSymbolicName]] constraint (expression)
```
clobbers：在汇编代码中，对于修改的寄存器、内存，需要在clobbers中声明，以免汇编器优化掉它们。

clobbers 说明

cc 表示汇编代码会修改标志寄存器

memory 表示汇编代码会修改内存

clobbers	说明
cc	表示汇编代码会修改标志寄存器
memory	表示汇编代码会修改内存