美文网首页
汇编(一)

汇编(一)

作者: 昵称是乱起的 | 来源:发表于2019-03-27 15:05 被阅读0次

1. 汇编的作用

在逆向开发中非常重要的一个环节就是静态分析,我们是逆向iOS系统上面的APP,一个APP安装在手机上面的可执行文件本质上是二进制文件,因为iPhone手机本质上执行的指令是二进制,是由手机上的CPU执行的,所以静态分析是建立在分析二进制上面。

2. 高级语言与汇编

代码在设备上的运行过程:


image.png
  • 汇编语言与机器语言一一对应,每一条机器指令都有与之对应的汇编指令
  • 汇编语言可以通过编译得到机器语言,机器语言可以通过反汇编得到汇编语言
  • 高级语言可以通过编译得到汇编语言 \ 机器语言,但汇编语言\机器语言几乎不可能还原成高级语言

3. 汇编的特点

  • 可以直接访问、控制各种硬件设备,比如存储器、CPU等,能最大限度地发挥硬件的功能
  • 能够不受编译器的限制,对生成的二进制代码进行完全的控制
  • 目标代码简短,占用内存少,执行速度快
  • 汇编指令是机器指令的助记符,同机器指令一一对应。每一种CPU都有自己的机器指令集\汇编指令集,所以汇编语言不具备可移植性
  • 知识点过多,开发者需要对CPU等硬件结构有所了解,不易于编写、调试、维护
  • 不区分大小写,比如mov和MOV是一样的

4. 汇编的用处

  1. 编写驱动程序、操作系统(比如Linux内核的某些关键部分)
  2. 对性能要求极高的程序或者代码片段,可与高级语言混合使用(内联汇编)
    软件安全:
    2.1. 病毒分析与防治
    2.2. 逆向\加壳\脱壳\破解\外挂\免杀\加密解密\漏洞\黑客
  3. 理解整个计算机系统的最佳起点和最有效途径
  4. 为编写高效代码打下基础
  5. 弄清代码的本质
    5.1. 函数的本质究竟是什么?
    5.2. ++a + ++a + ++a 底层如何执行的?
    5.3. 编译器到底帮我们干了什么?
    5.4. DEBUG模式和RELEASE模式有什么关键的地方被我们忽略

5. CPU、内存、总线等硬件结构

APP执行过程


image.png

iOS app是由内核从硬盘中读取加载到内存中,然后脱壳,dyld加载等过程

5.1 总线
  • 每一个CPU芯片都有许多管脚,这些管脚和总线相连,CPU通过总线跟外部器件进行交互
  • 总线:一根根导线的集合
  • 总线的分类:地址总线、数据总线、控制总线
    总线
    举个例子:
    image.png
    CPU想要从3号单元读取数据:首先通过地址线找到3号位置,通过控制线发送读的命令,通过数据线获取到数据08
    1. 地址总线
  • 它的宽度决定了CPU的寻址能力
  • 8086的地址总线宽度是20,所以寻址能力是1M( 2^20 )
    2. 数据总线
  • 它的宽度决定了CPU的单次数据传送量,也就是数据传送速度
  • 8086的数据总线宽度是16,所以单次最大传递2个字节的数据
    3. 控制总线
    它的宽度决定了CPU对其他器件的控制能力、能有多少种控制
5.2 内存
image.png
  • 内存地址空间的大小受CPU地址总线宽度的限制。8086的地址总线宽度为20,可以定位220个不同的内存单元(内存地址范围0x00000~0xFFFFF),所以8086的内存空间大小为1MB
  • 0x00000~0x9FFFF:主存储器。可读可写
  • 0xA0000~0xBFFFF:向显存中写入数据,这些数据会被显卡输出到显示器。可读可写
  • 0xC0000~0xFFFFF:存储各种硬件\系统信息。只读

6. 进制

  • 八进制由8个符号组成:0 1 2 3 4 5 6 7 逢八进一
  • 十进制由10个符号组成:0 1 2 3 4 5 6 7 8 9逢十进一
  • N进制就是由N个符号组成:逢N进一
    数学上的数字,是没有大小限制的,可以无限的大。但在计算机中,由于受硬件的制约,数据都是有长度限制的(我们称为数据宽度),超过最多宽度的数据会被丢弃。

6. CPU&寄存器

6.1 概述

CPU除了有控制器、运算器还有寄存器。其中寄存器的作用就是进行数据的临时存储。

CPU的运算速度是非常快的,为了性能CPU在内部开辟一小块临时存储区域,并在进行运算时先将数据从内存复制到这一小块临时存储区域中,运算时就在这一小快临时存储区域内进行。我们称这一小块临时存储区域为寄存器。

image.png

对于arm64系的CPU来说, 如果寄存器以x开头则表明的是一个64位的寄存器,如果以w开头则表明是一个32位的寄存器,其中32位的寄存器是64位寄存器的低32位部分并不是独立存在的。
对程序员来说,CPU中最主要部件是寄存器,可以通过改变寄存器的内容来实现对CPU的控制,不同的CPU,寄存器的个数、结构是不相同的

6.2 浮点和向量寄存器

  • 因为浮点数的存储以及其运算的特殊性,CPU中专门提供浮点数寄存器来处理浮点数,浮点寄存器 64位: d0 - d31 32位: s0 - s31


    浮点寄存器
    image.png
  • 现在的CPU支持向量运算,向量运算在图形处理相关的领域用得非常的多,为了支持向量计算系统了也提供了众多的向量寄存器,向量寄存器 128位:V0-V31


    image.png

6.3 通用寄存器

  • 通用寄存器也称数据地址寄存器通常用来做数据计算的临时存储、做累加、计数、地址保存等功能。定义这些寄存器的作用主要是用于在CPU指令中保存操作数,在CPU中当做一些常规变量来使用。
  • ARM64拥有有32个64位的通用寄存器 x0 到 x30,以及XZR(零寄存器),这些通用寄存器有时也有特定用途。那么w0 到 w28 这些是32位的. 因为64位CPU可以兼容32位.所以可以只使用64位寄存器的低32位.比如 w0 就是 x0的低32位!
    image.png
image.png

6.4 pc寄存器

image.png
  1. pc指令指针寄存器,它指示了CPU当前要读取指令的地址
  2. 在内存或者磁盘上,指令和数据没有任何区别,都是二进制信息
  3. CPU在工作的时候把有的信息看做指令,有的信息看做数据,为同样的信息赋予了不同的意义
  • 比如 1110 0000 0000 0011 0000 1000 1010 1010
  • 可以当做数据 0xE003008AA
  • 也可以当做指令 mov x0, x8
  1. CPU根据什么将内存中的信息看做指令?
  • CPU将pc指向的内存单元的内容看做指令
  • 如果内存中的某段内容曾被CPU执行过,那么它所在的内存单元必然被pc指向过

6.5 高速缓存

CPU每执行一条指令前都需要从内存中将指令读取到CPU内并执行。而寄存器的运行速度相比内存读写要快很多,为了性能,CPU还集成了一个高速缓存存储区域,当程序在运行时,先将要执行的指令代码以及数据复制到高速缓存中去(由操作系统完成),CPU直接从高速缓存依次读取指令来执行。

6.6 指令

str:写入到内存
ldr:读取到内存
orr:按位或
register read $x9读取寄存器x9的值
register write $x9 = 0x10240a03e修改寄存器x9的值

相关文章

  • <安全攻防之汇编基础>

    &关于汇编基础请点击 <汇编一> <汇编二> <汇编三> <汇编四> <汇编五> <汇编六> <汇编七> <汇编八...

  • 逆向笔记(三)-汇编指令

    汇编指令 针对汇编来说,汇编指令是必须了解的,而且汇编中汇编指令比较多,但是每一个汇编指令对应的机器码是固定不变的...

  • 汇编一、初识汇编

    开发语言的发展 机器语言 由0和1组成的机器指令,如: 加:0100 0000 减:0100 1000 汇编语言 ...

  • 汇编(一) -- 初识汇编

    前言 最近准备学习汇编,然后在B站上看到叫iOS小贤的作者发的视频挺不错,打算跟着学,文章是看视频的笔记,最后有原...

  • 【汇编】一、初识汇编

    001--初识汇编 我们在学习逆向开发之前,我们要了解一个基本的逆向原理.首先我们是逆向iOS系统上面的APP.那...

  • iOS逆向学习(arm64汇编入门)

    iOS汇编 iOS汇编语音有很多钟。常见的有8086汇编、arm汇编、x86汇编等等。 arm汇编 iOS的架构从...

  • ARM64汇编入门 - 汇编基础

    ARM64汇编入门 - 汇编基础ARM64汇编入门 - 汇编基础

  • 汇编基础笔记一

    汇编指令 汇编代码,高级语言-》汇编代码-》二进制-》计算机执行 高级语言只能转换成一种汇编代码,汇编代码可能转换...

  • asm 汇编器及虚拟机

    汇编器是用于把汇编语言翻译为机器语言的程序 汇编 汇编器, 将汇编一比一翻译为机器码 虚拟机程序 将汇编翻译成机器...

  • ARM64汇编学习笔记一(初始汇编)

    ARM64汇编学习笔记一(初始汇编)

网友评论

      本文标题:汇编(一)

      本文链接:https://www.haomeiwen.com/subject/dvsgvqtx.html