【序章】汇编基础总结

Author： PoilZero
发布时间：January 23, 2021
1056 views
No comments
4392 words
Categories： CTF-Summary

汇编基础总结

本文讨论的是32位intel处理器的汇编

单位

因为计算机本质是二进制的电平01因此最小底层的单位是位bit，一位只有两种状态0/1；而一般而言，为了保证有储存的信息量有一定程度计算机对数据的储存一般是以1字节byte（8位）作为最小储存单位；而为了方方便显示查看一般将每个字节转换位十六进制表示，也就是两位十六进制表示。

在汇编中常见的单位

byte 字节 8位二进制 2位十六进制
word 字

关键字	中文名	二进制长度	十六进制从长度
bit	位	1	四位才有一个长度
byte	字节	8	2
word	字	16	4
dword	双字	32	8

而对一般而言的32位处理器，即代表32个bit，4个byte，2个word，一个dword。

位运算指令

汇编中的指令使用分为指令名和操作数
指令名操作数1,操作数2
代表初始值位操作数1然后经过指令使用操作数2进行变换之后把结果保存到操作数1类似操作数1+=操作数2，操作数1=操作数2
一般来说：大部分的汇编指令两个操作数不能同时为内存，一般默认这种情况，如有特殊会说明

基本含义	汇编表示	C语言表示
与 a&b	and a,b	a&=b
或 a\	b	or a,b	a\	=b
异或 a^b	xor a,b	a^=b
非 ~a	not a	a~=a

加 +	add a,b	a+=b
减 -	sub a,b	a-=b

自增 in-count	inc a	a++
自减 de-count	dec a	a--

通用寄存器

完整显示形式

汇编中对于寄存器的操作是直接使用寄存器名称的
类似寄存器的变量名

寄存器	特殊用途（约定俗成）	编号
EAX	~	0
ECX	~	1
EDX	~	2
EBX	~	3

ESP	存储内存中栈顶的地址	4
EBP	存储内存中栈底的地址	5

ESI		6
EDI		7

其他显示形式

EAX ECX EDX EBX的E代表者32位
用十六进制表示就是AA BB CC DD（从左到右，从高到低位——
为了向下兼容16位，8位有如下的显示方式

去掉E就是低位的十六位，也就是四个十六进制，例如

AX CX DX BX：CC DD

而低位的十六位可以分为两个八位高位High，低位Low，即在十六位表示的基础上把X替换成对应高低位表示，例如

AH CH DH BH：CC
AL CL DL BL：DD

标志寄存器

各位简介

EIP始终指向当前程序运行到哪一行代码的代码地址
C位（Carry Flag 进位标志）：更准确的来说是无符号数是否溢出的
P位（Parity Flag）：也就是，运算结果中二进制表示的数据，1个数的奇偶
- 偶数个1：为1
- 奇数个1：为0
A位（Auxiliary Carry Flag 辅助进位标志）：运算结果中半个数据宽度的低位组的最高位是否进位或借位
- 发生进位或者借位为1，不发生则为0
- 例如0000 1000变成0001 0000那么就发生了进位A=1
- 例如0001 0000变成0000 1000那么就发生了进位A=1
Z位（Zero Flag零位标志）：运算结果是否为0
- 是0标志为1
- 是1标志位0
S位（Sign Flag符号标志）：数值等于运算结果的最高位
- 因此如果把运算结果当作有符号数
- S=1则运算结果为负数，反之为正数
- 如果当作无符号数则这个标志位是没有意义的
O位（Overflow Flag溢出标志位）：更准确的来说是代表有符号数是否溢出的标志

*C，O位区分

作为无符号数运算看：C位
- 字面意义上理解的是否有溢出数据宽度
作为有符号数运算看：O位
- 正加正为负（首位变为1）则溢出
- 负加负为正（首位变为0）则溢出
- 负加正无论如何不溢出，因为不可能超过数据宽度

储存指令

共性

立即数：即数字一般用十六进制表示如0xFFFFFF
寄存器：即上一个标题讲的内容，用寄存器名称表示
内存：单位 ptr ds:[地址]
- 单位只有byte，word，dword
- 地址一般用十六进制表示
- 这个表示过程就相当于对[]的地址进行寻址

mov：=

本质上是赋值
除了内存到内存的赋值不能使用它其余的三种数据都可以随意储存

例如

mov eax,ebx
mov dx,cx
mov bl,cl

lea：a=&b

本质上是取址保存

例如

mov eax,ebx
xor eax,ebx
;等价于 mov edx,eax*2+ebx
;也就是先*后&
lea edx,byte ptr ds:[eax*2 + ebx]

push：入栈

规范：push 存入的数。这样会存入对应宽度的数到达栈顶
数据宽度为32位（dword，八个十六进制），16位（word，四个十六进制）不能更小
- 但是有例外：立即数可以存入最小8位的也就是一个字节byte
内存中最小的地址单位是byte，8位（两个十六进制）

pop：出栈

规范：pop 取出的数存入的位置。这样会取出对应宽度的数存道对应的位置
取出的数据宽度为32位（dword，八个十六进制），16位（word，四个十六进制）不能更小

push 0xFFFFFFFF
push 0xAAAAAAAA

pop eax ;取出的是0xAAAAAAAA
pop ebx ;取出的是0xFFFFFFFF

pushad和popad

无操作数
pushad是吧寄存器的数值存入栈顶
popad是吧栈顶的的数值8组32位（8x8=64个地址）的值存入寄存器
如果pushad后和popad前的栈顶位置相同，那么具有还原寄存器原有数值的功能，这也被称为堆栈平衡

跳转指令

jmp：无条件跳转

本质是修改EIP的值，因为EIP代表程序下一步指向的指令地址，所以代表着跳转
规范：jmp 指令地址。指令地址可以用寄存器或者立即数表示

call：一般用于函数调用

步骤
1. 计算并且保存jmp前的下一行代码的地址，并push进栈中
2. jmp到对应地址
3. 继续执行
4. 直到retn（return）
  1. pop eax
  2. jump eax

cmp：相等与否

本质：是sub指令但是不修改数值只是修改标志
如果相同：则Z位标志为会变成1，即相减等于0

test：检查是否全为0

本质：and指令但是不修改数值只修改标志
例如test eax,eax
如果为空：则Z位标志为会变成1，即相减等于0

根据符号位的条件条件跳转

我也没记，用的的时候现查，用多了就记住了https://blog.csdn.net/xuehuafeiwu123/article/details/77480167

Last modification：June 29, 2021

如果觉得我的文章对你有用，请随意赞赏。咖啡（12RMB）进度+100%，一块巧克力（1RMB）进度+6%。
（赞赏请备注你的名称哦！后台记录中来自理工小菜狗）

【序章】汇编基础总结

PoilZero • 2021 年 01 月 23 日

<h1>汇编基础总结</h1><blockquote>本文讨论的是32位intel处理器的汇编<br><img src="http://poilzero.cn/usr/themes/handsome/assets/img/loading.svg" alt="image.png" title="image.png" style=""data-original="http://poilzero.sipc115.club/usr/uploads/2021/06/1130416125.png"></blockquote><h2>单位</h2><p>因为计算机本质是二进制的电平01因此最小底层的单位是位bit，一位只有两种状态0/1；而一般而言，为了保证有储存的信息量有一定程度计算机对数据的储存一般是以1字节byte（8位）作为最小储存单位；而为了方方便显示查看一般将每个字节转换位十六进制表示，也就是两位十六进制表示。</p><p>在汇编中常见的单位</p><ul><li>byte 字节 8位二进制 2位十六进制</li><li>word 字</li></ul><table><thead><tr><th>关键字</th><th>中文名</th><th>二进制长度</th><th>十六进制从长度</th></tr></thead><tbody><tr><td>bit</td><td>位</td><td>1</td><td>四位才有一个长度</td></tr><tr><td>byte</td><td>字节</td><td>8</td><td>2</td></tr><tr><td>word</td><td>字</td><td>16</td><td>4</td></tr><tr><td>dword</td><td>双字</td><td>32</td><td>8</td></tr></tbody></table><p>而对一般而言的32位处理器，即代表32个bit，4个byte，2个word，一个dword。</p><h2>位运算指令</h2><blockquote><p>汇编中的指令使用分为指令名和操作数</p><p><code>指令名 操作数1,操作数2</code></p><p>代表初始值位<code>操作数1</code>然后经过指令使用<code>操作数2</code>进行变换之后把结果保存到<code>操作数1</code>类似<code>操作数1+=操作数2</code>，<code>操作数1=操作数2</code></p><p>一般来说：大部分的汇编指令两个操作数不能同时为内存，一般默认这种情况，如有特殊会说明</p></blockquote><table><thead><tr><th>基本含义</th><th>汇编表示</th><th>C语言表示</th></tr></thead><tbody><tr><td>与 a&b</td><td>and a,b</td><td>a&=b</td></tr><tr><td>或 a\</td><td>b</td><td>or a,b</td><td>a\</td><td>=b</td></tr><tr><td>异或 a^b</td><td>xor a,b</td><td>a^=b</td></tr><tr><td>非 ~a</td><td>not a</td><td>a~=a</td></tr><tr><td> </td><td> </td><td> </td></tr><tr><td>加 +</td><td>add a,b</td><td>a+=b</td></tr><tr><td>减 -</td><td>sub a,b</td><td>a-=b</td></tr><tr><td> </td><td> </td><td> </td></tr><tr><td>自增 in-count</td><td>inc a</td><td>a++</td></tr><tr><td>自减 de-count</td><td>dec a</td><td>a--</td></tr></tbody></table><h2>通用寄存器</h2><h3>完整显示形式</h3><blockquote><p>汇编中对于寄存器的操作是直接使用寄存器名称的</p><p>类似寄存器的变量名</p></blockquote><table><thead><tr><th>寄存器</th><th>特殊用途（约定俗成）</th><th>编号</th></tr></thead><tbody><tr><td>EAX</td><td>~</td><td>0</td></tr><tr><td>ECX</td><td>~</td><td>1</td></tr><tr><td>EDX</td><td>~</td><td>2</td></tr><tr><td>EBX</td><td>~</td><td>3</td></tr><tr><td> </td><td> </td><td> </td></tr><tr><td>ESP</td><td>存储内存中栈顶的地址</td><td>4</td></tr><tr><td>EBP</td><td>存储内存中栈底的地址</td><td>5</td></tr><tr><td> </td><td> </td><td> </td></tr><tr><td>ESI</td><td> </td><td>6</td></tr><tr><td>EDI</td><td> </td><td>7</td></tr></tbody></table><h3>其他显示形式</h3><blockquote><p>EAX ECX EDX EBX的E代表者32位</p><p>用十六进制表示就是<code>AA BB CC DD</code>（从左到右，从高到低位——</p><p>为了向下兼容16位，8位有如下的显示方式</p></blockquote><p>去掉E就是低位的十六位，也就是四个十六进制，例如</p><p>AX CX DX BX：<code>CC DD</code></p><p>而低位的十六位可以分为两个八位高位High，低位Low，即在十六位表示的基础上把X替换成对应高低位表示，例如</p><ul><li>AH CH DH BH：<code>CC</code></li><li>AL CL DL BL：<code>DD</code></li></ul><h2>标志寄存器</h2><h3>各位简介</h3><p><img src="http://poilzero.cn/usr/themes/handsome/assets/img/loading.svg" alt="OD中的寄存器窗口" title="OD中的寄存器窗口" style=""data-original="https://s3.ax1x.com/2021/01/24/sHHWCR.png"></p><ul><li>EIP始终指向当前程序运行到哪一行代码的代码地址</li><li>C位（Carry Flag 进位标志） ：更准确的来说是无符号数是否溢出的</li><li><p>P位（Parity Flag）：也就是，运算结果中二进制表示的数据，1个数的奇偶</p><ul><li>偶数个1：为1</li><li>奇数个1：为0</li></ul></li><li><p>A位（Auxiliary Carry Flag 辅助进位标志）：运算结果中半个数据宽度的低位组的最高位是否进位或借位</p><ul><li>发生进位或者借位为1，不发生则为0</li><li>例如<code>0000 1000</code>变成<code>0001 0000</code>那么就发生了进位<code>A=1</code></li><li>例如<code>0001 0000</code>变成<code>0000 1000</code>那么就发生了进位<code>A=1</code></li></ul></li><li><p>Z位（Zero Flag零位标志）：运算结果是否为0</p><ul><li>是0标志为1</li><li>是1标志位0</li></ul></li><li><p>S位（Sign Flag符号标志）：数值等于运算结果的最高位</p><ul><li>因此如果把运算结果当作有符号数</li><li><code>S=1</code>则运算结果为负数，反之为正数</li><li>如果当作无符号数则这个标志位是没有意义的</li></ul></li><li>O位（Overflow Flag溢出标志位）：更准确的来说是代表有符号数是否溢出的标志</li></ul><h3>*C，O位区分</h3><ul><li><p>作为无符号数运算看：C位</p><ul><li>字面意义上理解的是否有溢出数据宽度</li></ul></li><li><p>作为有符号数运算看：O位</p><ul><li>正加正为负（首位变为1）则溢出</li><li>负加负为正（首位变为0）则溢出</li><li>负加正 无论如何不溢出，因为不可能超过数据宽度</li></ul></li></ul><h2>储存指令</h2><h3>共性</h3><ul><li>立即数：即数字一般用十六进制表示如<code>0xFFFFFF</code></li><li>寄存器：即上一个标题讲的内容，用寄存器名称表示</li><li><p>内存：<code>单位 ptr ds:[地址]</code></p><ul><li>单位只有<code>byte</code>，<code>word</code>，<code>dword</code></li><li>地址一般用十六进制表示</li><li>这个表示过程就相当于对[]的地址进行寻址</li></ul></li></ul><h3>mov：=</h3><ul><li>本质上是赋值</li><li>除了内存到内存的赋值不能使用它其余的三种数据都可以随意储存</li></ul><p>例如</p><pre><code class="lang-assembly">mov eax,ebx
mov dx,cx
mov bl,cl</code></pre><h3>lea：a=&b</h3><ul><li>本质上是取址保存</li></ul><p>例如</p><pre><code class="lang-assembly">mov eax,ebx
xor eax,ebx
;等价于 mov edx,eax*2+ebx
;也就是先*后&amp;
lea edx,byte ptr ds:[eax*2 + ebx]</code></pre><h3>push：入栈</h3><ul><li>规范：<code>push 存入的数</code>。这样会存入对应宽度的数到达栈顶</li><li><p>数据宽度为32位（dword，八个十六进制），16位（word，四个十六进制）不能更小</p><ul><li>但是有例外：立即数可以存入最小8位的也就是一个字节byte</li></ul></li><li>内存中最小的地址单位是byte，8位（两个十六进制）</li></ul><h3>pop：出栈</h3><ul><li>规范：<code>pop  取出的数存入的位置</code>。这样会取出对应宽度的数存道对应的位置</li><li>取出的数据宽度为32位（dword，八个十六进制），16位（word，四个十六进制）不能更小</li></ul><pre><code class="lang-assembly">push 0xFFFFFFFF
push 0xAAAAAAAA

pop eax ;取出的是0xAAAAAAAA
pop ebx ;取出的是0xFFFFFFFF</code></pre><h3>pushad和popad</h3><ul><li>无操作数</li><li>pushad是吧寄存器的数值存入栈顶</li><li>popad是吧栈顶的的数值8组32位（8x8=64个地址）的值存入寄存器</li><li>如果pushad后和popad前的栈顶位置相同，那么具有还原寄存器原有数值的功能，这也被称为堆栈平衡</li></ul><h2>跳转指令</h2><h3>jmp：无条件跳转</h3><ul><li>本质是修改EIP的值，因为EIP代表程序下一步指向的指令地址，所以代表着跳转</li><li>规范：<code>jmp 指令地址</code>。指令地址可以用寄存器或者立即数表示</li></ul><h3>call：一般用于函数调用</h3><ul><li><p>步骤</p><ol><li>计算并且保存jmp前的下一行代码的地址，并push进栈中</li><li>jmp到对应地址</li><li>继续执行</li><li><p>直到retn（return）</p><ol><li>pop eax</li><li>jump eax</li></ol></li></ol></li></ul><h3>cmp：相等与否</h3><ul><li>本质：是sub指令但是不修改数值只是修改标志</li><li>如果相同：则Z位标志为会变成1，即相减等于0</li></ul><h3>test：检查是否全为0</h3><ul><li>本质：and指令但是不修改数值只修改标志</li><li>例如<code>test eax,eax</code></li><li>如果为空：则Z位标志为会变成1，即相减等于0</li></ul><h3>根据符号位的条件条件跳转</h3><p>我也没记，用的的时候现查，用多了就记住了<span class="external-link"><a class="no-external-link" href="https://blog.csdn.net/xuehuafeiwu123/article/details/77480167" target="_blank"><i data-feather="external-link"></i>https://blog.csdn.net/xuehuafeiwu123/article/details/77480167</a></span></p>

汇编基础总结

单位

位运算指令

通用寄存器

完整显示形式

其他显示形式

标志寄存器

各位简介

*C，O位区分

储存指令

共性

mov：=

lea：a=&b

push：入栈

pop：出栈

pushad和popad

跳转指令

jmp：无条件跳转

call：一般用于函数调用

cmp：相等与否

test：检查是否全为0

根据符号位的条件条件跳转

Leave a Comment Cancel reply 写下邮箱是为了同步你的头像噢

【序章】汇编基础总结

Leave a Comment Cancel reply
写下邮箱是为了同步你的头像噢