【博文连载】ARM编译器(一)ARM汇编与ARM GNU汇编

一、ARM汇编开发的两种的方式

ARM汇编开发指用ARM提供的汇编指令,进行ARM程序的开发。

ARM汇编开发,有两种开发方式,一种是使用ARM汇编,一种是使用ARM GNU汇编。两种汇编开发,使用的汇编指令是完全一样的,区别是宏指令,伪指令,伪操作不一样。其实两种开发方式的区别在于所使用的编译工具不一样。

对于ARM汇编,使用的是ARM公司开发的编译器,而ARM GNU汇编,是使用GNU为ARM指令集开发的编译器,也就是arm-gcc。

二、ARM的编译开发环境

两种常用的ARM的编译开发环境

三、伪操作,宏指令,伪指令

伪操作:ARM汇编语言程序里的一些特殊指令助记符,其作用主要是完成汇编程序做各种准备工作,在源程序进行汇编时由汇编程序处理,而不是在计算机运行期间由机器执行。如程序段的定义,就属于伪操作。

宏指令:一段独立的程序代码,可插在源程序中,通过伪操作来定义。

伪指令:ARM汇编语言程序里的一些特殊指令助记符,不在处理器运行期间执行,在汇编时,被合适的ARM的机器指令代替,从而实现真正的指令操作。

四、ARM汇编伪操作

伪操作

语法格式

作用

GBLA

GBLA Varible

声明一个全局的算术变量,并将其初始化为0

GBLL

GBLL Varible

声明一个全局的逻辑变量,并将其初始化成{FALSE}

GBLS

GBLS Varible

声明一个全局的字符串变量,并将其初始化成空串

LCLA

LCLA Varible

声明一个局部的算术变量,并将其初始化为0

LCLL

LCLL Varible

声明一个局部的逻辑变量,并将其初始化成{FALSE}

LCLS

LCLS Varible

声明一个局部的字符串变量,并将其初始化成空串

SETA

SETA Varible expr

给一个全局或局部算术变量赋值

SETL

SETL Varible expr

给一个全局或局部逻辑变量赋值

SETS

SETS Varible expr

给一个全局或局部字符串变量赋值

RLIST

name LIST {list of registers}

为一个通用寄存器列表定义名称

CN

name CN expr

为一个协处理器的寄存器定义名称

CP

name CP expr

为一个协处理器定义名称

DN/SN

name DN/SN expr

DN/SN为一个双精度/单精度的VFP寄存器定义名称

FN

name FN expr

为一个FPA浮点寄存器定义名称

LTORG

LTONG

声明一个数据缓冲池(文字池)的开始

MAP

MAP expr {, base-register}

定义一个结构化的内存表(storage map)的首地址

FIELD

{label} FIELF expr

定义一个结构化内存表中的数据域

SPACE

{label} SPACE expr

分配一块连续内存单元,并用0初始化

DCB

{label} DCB expr {,expr}..

分配一块字节内存单元,并用expr初始化

DCD/ DCDU

{label} DCD/DCDU expr {,expr}…

分配一块字内存单元, 并用expr初始化

DCDO

{label} DCDO expr {,expr}…

分配一块字对齐的字内存单元, 并用expr初始化

DCFD/DCFDU

{label} DCFD{U} fpliteral

,{,fpliteral}…

为双精度的浮点数分配字对齐的内存单元

DCFS/DCFSU

{label} DCFS{U} fpliteral

,{,fpliteral}…

为单精度的浮点数分配字对齐的内存单元

DCI

{label} DCI expr, {expr}…

ARM代码分配一段字对齐的内存单元,填充expr(二进制指令码),THUMB代码中,分配一段半字对齐的半字内存单元。

DCQ/ DCQU

{label} DCQ{U} {-} literal,

{, {-} literal}…

分配一段以双字(8个字节)为单位的内存

DCW/DCWU

{label} DCW{U} {-} literal,

{, {-} literal}…

DCW用于分配一段半字对齐的半字内存单元

1、AREA

创建一段新的程序代码或数据区。

格式 : AREA name, {,attr,} …

其中,name是程序段名, atrr是段名属性

对于属性,有以下一些:

2、ALIGN

指定对齐

ALIGN 4 表示4字节地址对齐

ALIGN 8 表示8字节地址对齐

注意:在AREA中使用和单独使用ALIGN的区别,在于格式和对齐的计算不一样。

3、ENTRY

指定汇编程序的入口。

一个程序至少有一个入口点,也可以有多个入口点,但是在一个源文件中,最多只能有一个ENTRY。当多个源文件均有ENTRY时,由链接器指定程序真正的入口。

4、END

表示源程序的结束

所以汇编语言源文件必须以END结束,汇编器遇到END, 将结束编译。

5、EXPORT

格式:EXPORT 标号 [,WEAK]

声明一个全局标号,其他源文件可以使用这个标号。WEAK表示碰上其他同名标号时,其他标号优先。

6、IMPORT

格式: IMPORT 标号,[,WEAK]

表示该引用的标号在其他源文件中,单要在当前文件中引用。WEAK表示找不到该标号时,也不报错,一般该标号置为0,如果是B 或BL指令用到该标号,该指令置为nop。

该标号会加入到当前源文件的符号表中。

7、EXTERN

和IMPORT一样,不同在于,如果当前文件没有引用该标号,该标号不会加入到当前源文件的符号表中。

8、GET(或INCLUDE)

将一个源文件包含到当前的源文件中

9、EQU

对一个常量标号赋值

格式: name EQU expression

其中: name符号名, expression寄存器相关或者程序相关的固定值

如:

num EQU 2 ; 为符号赋予数字2

EQU,等同于C语言中用#define定义一个常量

10、SPCAE

用于分配一片连续内存单元,并用0初始化。SPACE可用%代替。

格式: {label} SPACE expr

label : 是一个标号, 可选

expr: 分配的内存字节数

stack SPACE 100 ; 分配100个字节内存单元,并用0初始化。标号stack是这片空间的起始地址

11、DCB

用于分配段字节内存单元,并用伪操作中的expr初始化。

格式: {label} DCB expr {,expr}

label: 是一个标号,可选

expr: 可以是-128~255的数值或者字符串

如:

string DCB "HELLO" ;为HELLO字符串分配空间, string是这块空间的起始地址

12、DCD及DCDU

用于分配段字内存单元(分配的内存都是字对齐,DCDU并不严格字对齐),并用伪操作中的expr初始化。 DCD 可用 & 代替。

格式: {label} DCD expr, {,expr}

label: 是一个标号,可选,表示这块内存单元的首地址

expr: 数字表达式或程序中的标号

如:

data DCD 1,2,3,4 ;分配字对齐的字单元空间,初始化为1,2,3,4

五、ARM汇编伪指令

ARM伪指令包括: ADR, ADRL,LDR ,NOP

THUMB伪指令包括:ADR, LDR, NOP

伪指令

语法格式

作用

ADR

ADR{cond} register, expr

将基于PC或基于寄存器的地址值读取到寄存器中。小范围的地址读取

ADRL

ADRL{cond} register, expr

将给予PC或基于寄存器的地址值读取到寄存器中。中等范围的地址读取

LDR

LDR {cond} register,

=[expr|label]

将一个32位的立即数或者一个地址值读取到寄存器中。大范围的地址读取

NON

NOP

在汇编时,被替换成空操作

六、ARM GNU编译环境

伪操作

语法格式

作用

.byte

.byte expr {,expr}…

分配一段字节内存单元,并用expr初始化

.hword/.short

.hword expr {,expr}…

分配一段半字内存单元,并用expr初始化

.ascii

.ascii expr {,expr}…

定义字符串expr

.asciz/.string

.asciz expr {,expr}…

定义字符串expr(会增加/0为结束符)

.floar/.single

.float expr {,expr}…

定义32bit IEEE浮点数expr

.double

.doubel expr {,expr}…

定义64bit IEEE浮点数expr

.word/.long/.int

.word expr {,expr}…

分配一段字内存单元,并用expr初始化

.fill

.fill repeat {,size} {,value}

分配一段字节内存单元,用sieze长度value填充repeat次

.zero

.zero size

分配一段字节内存单元,并用0填充内存

.space/.skip

.space size, {,value}

分配一段内存单元,用value将内存初始化

.section

.section expr

定义一个段

.text

.text {subsection}

代码段,

.data

.data{subsection}

数据段

.bss

.bss{subsection}

bss段

.cond 16/.thumb

.code 16/.thumb

表示之后的汇编指令使用THUMB指令集

.code 32/.arm

.code 32/.arm

表示之后的汇编指令使用ARM指令集

.end

.end

标记汇编文件的结束

.include

.include "filename"

将一个源文件包含到当前源文件中

.align/.balign

.align {alignment} {,fill},{max}

7. 从0学ARM-汇编伪指令、lds详解

.arm

定义一下代码使用ARM指令集编译

.thumb

定义一下代码使用Thumb指令集编译

.section

.section expr 定义一个段。expr可以使.text .data. .bss

.text

.text {subsection} 将定义符开始的代码编译到代码段

.data

.data {subsection} 将定义符开始的代码编译到数据段,初始化数据段

.bss

.bss {subsection} 将变量存放到.bss段,未初始化数据段

.align

.align{alignment}{,fill}{,max} 通过用零或指定的数据进行填充来使当前位置与指定边界对齐

.align 4 --- 16字节对齐 2的4次方

.align (4) --- 4字节对齐

.org

.org offset{,expr} 指定从当前地址加上offset开始存放代码,并且从当前地址到当前地址加上offset之间的内存单元,用零或指定的数据进行填充

.extern

用于声明一个外部符号,用于兼容性其他汇编

.code 32

同.arm

.code 16

同.thumb

.weak

用于声明一个弱符号,如果这个符号没有定义,编译就忽略,而不会报错

.end

文件结束

.include

.include “filename” 包含指定的头文件, 可以把一个汇编常量定义放在头文件中

.equ

格式:.equ symbol, expression把某一个符号(symbol)定义成某一个值(expression).该指令并不分配空间,类似于c语言的 #define

.set

给一个全局变量或局部变量赋值,和.equ的功能一样

举例:.set

.set start, 0x40
mov r1, #start      ;r1里面是0x40

举例.equ

.equ   start,  0x40                                      
mov r1, #start      ;r1里面是0x40     

#define  PI  3.1415

等价于

.equ   PI, 31415

五、GNU伪指令

关键点:伪指令在编译时会转化为对应的ARM指令

ADR伪指令 :该指令把标签所在的地址加载到寄存器中。ADR伪指令为小范围地址读取伪指令,使用的相对偏移范围:当地址值是字节对齐 (8位) 时,取值范围为-255~255,当地址值是字对齐 (32位) 时,取值范围为-1020~1020。语法格式:

   ADR{cond}   register,label
 ADR      R0,  lable

ADRL伪指令:将中等范围地址读取到寄存器中

ADRL伪指令为中等范围地址读取伪指令。使用相对偏移范围:当地址值是字节对齐时,取值范围为-64~64KB;当地址值是字对齐时,取值范围为-256~256KB

语法格式:

ADRL{cond}   register,label
ADRL        R0,lable

LDR伪指令:LDR伪指令装载一个32位的常数和一个地址到寄存器。语法格式:

LDR{cond}  register,=[expr|label-expr]
LDR    R0,=0XFFFF0000      ;mov r1,#0x12   对比一下

注意:(1)ldr伪指令和ldr指令区分下面是ldr伪指令:

ldr r1,=val  @ r1 = val   是伪指令,将val标号地址赋给r1    
【与MDK不一样,MDK只支持ldr r1,=val】

下面是ldr指令:

ldr r2,val   @ r1 = *val    是arm指令,将标号val地址里的内容给r2
val: .word 0x11223344

(2)如何利用ldr伪指令实现长跳转

  ldr  pc,=32位地址

(3)编码中解决非立即数的问题用arm伪指令ldr

ldr r0,=0x999   ;0x999  不是立即数,

六、GNU汇编的编译1. 不含lds文件的编译

假设我们有以下代码,包括1个main.c文件,1个start.s文件:start.s

.global _start
_start:      @汇编入口
 ldr sp,=0x41000000
 b main
.global mystrcopy
.text
mystrcopy: //参数dest->r0,src->r2
  LDRB r2, [r1], #1
  STRB r2, [r0], #1
  CMP r2, #0 //判断是不是字符串尾
  BNE mystrcopy
  MOV pc, lr
stop:
 b stop   @死循环,防止跑飞 等价于while(1)
.end         @汇编程序结束

main.c

extern void mystrcopy(char *d,const char *s);
int main(void)
{
 const char *src ="yikoulinux";
 char dest[20]={};
 mystrcopy(dest,src);//调用汇编实现的mystrcopy函数
 while(1);
    return 0;
}

Makefile编写方法如下:

1. TARGET=start   
2. TARGETC=main
3. all:
4.   arm-none-linux-gnueabi-gcc -O0 -g -c -o $(TARGETC).o  $(TARGETC).c
5.    arm-none-linux-gnueabi-gcc -O0 -g -c -o $(TARGET).o $(TARGET).s
6.    #arm-none-linux-gnueabi-gcc -O0 -g -S -o $(TARGETC).s  $(TARGETC).c  
7.    arm-none-linux-gnueabi-ld $(TARGETC).o $(TARGET).o -Ttext 0x40008000 -o $(TARGET).elf
8.    arm-none-linux-gnueabi-objcopy   -O binary -S  $(TARGET).elf  $(TARGET).bin
9. clean:
10.  rm -rf *.o *.elf *.dis *.bin

Makefile含义如下:

定义环境变量TARGET=start,start为汇编文件的文件名

定义环境变量TARGETC=main,main为c语言文件

目标:all,4~8行是该指令的指令语句

将main.c编译生成main.o,$(TARGETC)会被替换成main

将start.s编译生成start.o,$(TARGET)会被替换成start

4-5也可以用该行1条指令实现

通过ld命令将main.o、start.o链接生成start.elf,-Ttext 0x40008000表示设置代码段起始地址为0x40008000

通过objcopy将start.elf转换成start.bin文件,-O binary (或--out-target=binary) 输出为原始的二进制文件,-S (或 --strip-all)输出文件中不要重定位信息和符号信息,缩小了文件尺寸,

clean目标

clean目标的执行语句,删除编译产生的临时文件

【补充】

gcc的代码优化级别,在 makefile 文件中的编译命令4级 O0 -- O3 数字越大,优化程度越高。O3最大优化

volatile作用volatile修饰的变量,编译器不再进行优化,每次都真正访问内存地址空间。

2. 依赖lds文件编译

实际的工程文件,段复杂程度远比我们这个要复杂的多,尤其Linux内核有几万个文件,段的分布及其复杂,所以这就需要我们借助lds文件来定义内存的分布。

文件列表

main.c和start.s和上一节一致。

map.lds

OUTPUT_FORMAT("elf32-littlearm""elf32-littlearm""elf32-littlearm")
/*OUTPUT_FORMAT("elf32-arm", "elf32-arm", "elf32-arm")*/
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS
{
 . = 0x40008000;
 . = ALIGN(4);
 .text      :
 {
  .start.o(.text)
  *(.text)
 }
 . = ALIGN(4);
    .rodata : 
 { *(.rodata) }
    . = ALIGN(4);
    .data : 
 { *(.data) }
    . = ALIGN(4);
    .bss :
     { *(.bss) }
}

解释一下上述的例子:

OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm")指定输出object档案预设的binary 文件格式。可以使用objdump -i列出支持的binary 文件格式;

OUTPUT_ARCH(arm) 指定输出的平台为arm,可以透过objdump -i查询支持平台;

ENTRY(_start) :将符号_start的值设置成入口地址;

. = 0x40008000: 把定位器符号置为0x40008000(若不指定, 则该符号的初始值为0);

.text : { .start.o(.text) *(.text) } :前者表示将start.o放到text段的第一个位置,后者表示将所有(*符号代表任意输入文件)输入文件的.text section合并成一个.text section;

.rodata : { *(.data) } : 将所有输入文件的.rodata section合并成一个.rodata section;

.data : { *(.data) } : 将所有输入文件的.data section合并成一个.data section;

.bss : { *(.bss) } : 将所有输入文件的.bss section合并成一个.bss section;该段通常存放全局未初始化变量

. = ALIGN(4);表示下面的段4字节对齐

连接器每读完一个section描述后, 将定位器符号的值增加该section的大小。

来看下,Makefile应该如何写:

# CORTEX-A9 PERI DRIVER CODE
# VERSION 1.0
# ATHUOR 一口Linux
# MODIFY DATE
2020.11.17  Makefile
#=================================================#
CROSS_COMPILE = arm-none-linux-gnueabi-
NAME =start
CFLAGS=-mfloat-abi=softfp -mfpu=vfpv3 -mabi=apcs-gnu -fno-builtin  -fno-builtin-function -g -O0 -c                                   
LD = $(CROSS_COMPILE)ld
CC = $(CROSS_COMPILE)gcc
OBJCOPY = $(CROSS_COMPILE)objcopy
OBJDUMP = $(CROSS_COMPILE)objdump
OBJS=start.o  main.o
#================================================#
all:  $(OBJS)
 $(LD)  $(OBJS) -T map.lds -o $(NAME).elf
 $(OBJCOPY)  -O binary  $(NAME).elf $(NAME).bin 
 $(OBJDUMP) -D $(NAME).elf > $(NAME).dis 
%.o: %.S 
 $(CC) $(CFLAGS) -c -o  $@ $<
%.o: %.s 
 $(CC) $(CFLAGS) -c -o  $@ $<
%.o: %.c
 $(CC) $(CFLAGS) -c -o  $@ $<
clean:
 rm -rf $(OBJS) *.elf *.bin *.dis *.o

编译结果如下:

编译结果

最终生成start.bin,改文件可以烧录到开发板测试,因为本例没有直观现象,后续文章我们加入其它功能再测试。

【注意】

其中交叉编译工具链「arm-none-linux-gnueabi-」 要根据自己实际的平台来选择,本例是基于三星的exynos-4412工具链实现的。

地址0x40008000也不是随便选择的,

exynos4412 地址分布

读者可以根据自己手里的开发板对应的soc手册查找该地址。

linux内核的异常向量表

linux内核的内存分布也是依赖lds文件定义的,linux内核的编译我们暂不讨论,编译好之后会再以下位置生成对应的lds文件:

arch/arm/kernel/vmlinux.lds

我们看下该文件的部分内容:

vmlinux.lds

OUTPUT_ARCH(arm)制定对应的处理器;

ENTRY(stext)表示程序的入口是stext。

同时我们也可以看到linux内存的划分更加的复杂,后续我们讨论linux内核,再继续分析该文件。

3. elf文件和bin文件区别:1) ELF

ELF文件格式是一个开放标准,各种UNIX系统的可执行文件都采用ELF格式,它有三种不同的类型:

ELF格式提供了两种不同的视角,链接器把ELF文件看成是Section的集合,而加载器把ELF文件看成是Segment的集合。

2) bin

BIN文件是直接的二进制文件,内部没有地址标记。bin文件内部数据按照代码段或者数据段的物理空间地址来排列。一般用编程器烧写时从00开始,而如果下载运行,则下载到编译时的地址即可。

在Linux OS上,为了运行可执行文件,他们是遵循ELF格式的,通常gcc -o test test.c,生成的test文件就是ELF格式的,这样就可以运行了,执行elf文件,则内核会使用加载器来解析elf文件并执行。

在Embedded中,如果上电开始运行,没有OS系统,如果将ELF格式的文件烧写进去,包含一些ELF文件的符号表字符表之类的section,运行碰到这些,就会导致失败,如果用objcopy生成纯粹的二进制文件,去除掉符号表之类的section,只将代码段数据段保留下来,程序就可以一步一步运行。

elf文件里面包含了符号表等。BIN文件是将elf文件中的代码段,数据段,还有一些自定义的段抽取出来做成的一个内存的镜像。

并且elf文件中代码段数据段的位置并不是它实际的物理位置。他实际物理位置是在表中标记出来的。

本站内容来自用户投稿,如果侵犯了您的权利,请与我们联系删除。联系邮箱:835971066@qq.com

本文链接:http://news.xiuzhanwang.com/post/1970.html

发表评论

评论列表

还没有评论,快来说点什么吧~

友情链接: