课程项目CSAPPCSAPP-Lab2-BombLab
Hoshea Zhangbomblab的背景很有趣。Dr. Evil把“二进制炸弹”装在了教室的机子里。想要拆掉炸弹,你必须反编译“炸弹”,通过其中的汇编指令推测出可以拆掉炸弹的phrase。
phase1
1 2 3 4 5 6 7 8 9
| 0000000000400ee0 <phase_1>: 400ee0: 48 83 ec 08 sub $0x8,%rsp 400ee4: be 00 24 40 00 mov $0x402400,%esi 400ee9: e8 4a 04 00 00 callq 401338 <strings_not_equal> 400eee: 85 c0 test %eax,%eax 400ef0: 74 05 je 400ef7 <phase_1+0x17> 400ef2: e8 43 05 00 00 callq 40143a <explode_bomb> 400ef7: 48 83 c4 08 add $0x8,%rsp 400efb: c3 retq
|
其实从第二行才正式开始:
mov $0x402400,%esi
先把一个值,即字符串的地址放到esi寄存器中
esi 普通的寄存器
401338 <strings_not_equal>
调用一个函数,判断这个函数的返回值
test %eax,%eax
test做按位与操作,为零时不设置值,但是设置SF、ZF、和PF标志位,并将CF和OF的标志位清零。
所以这里如果eax为0,则je跳转否则不跳,引爆炸弹
1 2 3 4 5
| 401338: 41 54 push %r12 40133a: 55 push %rbp 40133b: 53 push %rbx 40133c: 48 89 fb mov %rdi,%rbx 40133f: 48 89 f5 mov %rsi,%rbp
|
我们发现rsi存的就是上面的0x402400的字符串
gdb调试 x/s 0x402400
果然出现第一字符串:
Border relations with Canada have never been better.
phase2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
| 0000000000400efc <phase_2>: 400efc: 55 push %rbp 400efd: 53 push %rbx 400efe: 48 83 ec 28 sub $0x28,%rsp 400f02: 48 89 e6 mov %rsp,%rsi 400f05: e8 52 05 00 00 callq 40145c <read_six_numbers> 400f0a: 83 3c 24 01 cmpl $0x1,(%rsp) 400f0e: 74 20 je 400f30 <phase_2+0x34> 400f10: e8 25 05 00 00 callq 40143a <explode_bomb> 400f15: eb 19 jmp 400f30 <phase_2+0x34> 400f17: 8b 43 fc mov -0x4(%rbx),%eax 400f1a: 01 c0 add %eax,%eax 400f1c: 39 03 cmp %eax,(%rbx) 400f1e: 74 05 je 400f25 <phase_2+0x29> 400f20: e8 15 05 00 00 callq 40143a <explode_bomb> 400f25: 48 83 c3 04 add $0x4,%rbx 400f29: 48 39 eb cmp %rbp,%rbx 400f2c: 75 e9 jne 400f17 <phase_2+0x1b> 400f2e: eb 0c jmp 400f3c <phase_2+0x40> 400f30: 48 8d 5c 24 04 lea 0x4(%rsp),%rbx 400f35: 48 8d 6c 24 18 lea 0x18(%rsp),%rbp 400f3a: eb db jmp 400f17 <phase_2+0x1b> 400f3c: 48 83 c4 28 add $0x28,%rsp 400f40: 5b pop %rbx 400f41: 5d pop %rbp 400f42: c3 retq
|
phase3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
| 0000000000400f43 <phase_3>: 400f43: 48 83 ec 18 sub $0x18,%rsp 400f47: 48 8d 4c 24 0c lea 0xc(%rsp),%rcx 400f4c: 48 8d 54 24 08 lea 0x8(%rsp),%rdx 400f51: be cf 25 40 00 mov $0x4025cf,%esi 400f56: b8 00 00 00 00 mov $0x0,%eax 400f5b: e8 90 fc ff ff callq 400bf0 <__isoc99_sscanf@plt> 400f60: 83 f8 01 cmp $0x1,%eax 400f63: 7f 05 jg 400f6a <phase_3+0x27> 400f65: e8 d0 04 00 00 callq 40143a <explode_bomb> 400f6a: 83 7c 24 08 07 cmpl $0x7,0x8(%rsp) 400f6f: 77 3c ja 400fad <phase_3+0x6a> 400f71: 8b 44 24 08 mov 0x8(%rsp),%eax 400f75: ff 24 c5 70 24 40 00 jmpq *0x402470(,%rax,8) 400f7c: b8 cf 00 00 00 mov $0xcf,%eax 400f81: eb 3b jmp 400fbe <phase_3+0x7b> 400f83: b8 c3 02 00 00 mov $0x2c3,%eax 400f88: eb 34 jmp 400fbe <phase_3+0x7b> 400f8a: b8 00 01 00 00 mov $0x100,%eax 400f8f: eb 2d jmp 400fbe <phase_3+0x7b> 400f91: b8 85 01 00 00 mov $0x185,%eax 400f96: eb 26 jmp 400fbe <phase_3+0x7b> 400f98: b8 ce 00 00 00 mov $0xce,%eax 400f9d: eb 1f jmp 400fbe <phase_3+0x7b> 400f9f: b8 aa 02 00 00 mov $0x2aa,%eax 400fa4: eb 18 jmp 400fbe <phase_3+0x7b> 400fa6: b8 47 01 00 00 mov $0x147,%eax 400fab: eb 11 jmp 400fbe <phase_3+0x7b> 400fad: e8 88 04 00 00 callq 40143a <explode_bomb> 400fb2: b8 00 00 00 00 mov $0x0,%eax 400fb7: eb 05 jmp 400fbe <phase_3+0x7b> 400fb9: b8 37 01 00 00 mov $0x137,%eax 400fbe: 3b 44 24 0c cmp 0xc(%rsp),%eax 400fc2: 74 05 je 400fc9 <phase_3+0x86> 400fc4: e8 71 04 00 00 callq 40143a <explode_bomb> 400fc9: 48 83 c4 18 add $0x18,%rsp 400fcd: c3 retq
|
0x400f51 出现的 $0x4025cf 这个地址被保存到了%esi里,把它输出一下看看是什么
(gdb) x/s 0x4025cf
0x4025cf: “%d %d”
我们要过关,就要输入两个整数
mov $0x0,%eax
接下来回调 sscanf 之后函数返回值存在这个%eax里,然后又和 1 去比较,即输入大于一个参数炸弹才不会爆炸
```text
400f6a: 83 7c 24 08 07 cmpl $0x7,0x8(%rsp)
400f6f: 77 3c ja 400fad
400f71: 8b 44 24 08 mov 0x8(%rsp),%eax
400f75: ff 24 c5 70 24 40 00 jmpq *0x402470(,%rax,8)
1 2 3 4 5 6 7 8 9 10 11
| x86-64中,栈顶 %rsp 的前 8 位存的是函数的返回地址所在栈地址,从 8(%rsp)开始存第一个参数。为验证正确,试验一下,第一个参数输入1,寄存器该位确实是1,所以第一个数字为0-7
第二个数观察后面的代码,发现间接跳转到0x402470存储的地址
```asmt (gdb) x /16 0x402470 0x402470: 0x00400f7c 0x00000000 0x00400fb9 0x00000000 0x402480: 0x00400f83 0x00000000 0x00400f8a 0x00000000 0x402490: 0x00400f91 0x00000000 0x00400f98 0x00000000 0x4024a0: 0x00400f9f 0x00000000 0x00400fa6 0x00000000
|
可见当第一个参数为1时,第二个参数为0xcf即207
phase4
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
| 40100c: 48 83 ec 18 sub $0x18,%rsp 401010: 48 8d 4c 24 0c lea 0xc(%rsp),%rcx 401015: 48 8d 54 24 08 lea 0x8(%rsp),%rdx 40101a: be cf 25 40 00 mov $0x4025cf,%esi 40101f: b8 00 00 00 00 mov $0x0,%eax 401024: e8 c7 fb ff ff callq 400bf0 <__isoc99_sscanf@plt> 401029: 83 f8 02 cmp $0x2,%eax 40102c: 75 07 jne 401035 <phase_4+0x29> 40102e: 83 7c 24 08 0e cmpl $0xe,0x8(%rsp) 401033: 76 05 jbe 40103a <phase_4+0x2e> 401035: e8 00 04 00 00 callq 40143a <explode_bomb> 40103a: ba 0e 00 00 00 mov $0xe,%edx 40103f: be 00 00 00 00 mov $0x0,%esi 401044: 8b 7c 24 08 mov 0x8(%rsp),%edi 401048: e8 81 ff ff ff callq 400fce <func4> 40104d: 85 c0 test %eax,%eax 40104f: 75 07 jne 401058 <phase_4+0x4c> 401051: 83 7c 24 0c 00 cmpl $0x0,0xc(%rsp) 401056: 74 05 je 40105d <phase_4+0x51> 401058: e8 dd 03 00 00 callq 40143a <explode_bomb> 40105d: 48 83 c4 18 add $0x18,%rsp 401061: c3 retq
|
跟上面一样,可以先分析出来,输入两个整数
%rsp + 8 是我们输入的第一个参数的地址,把第一个参数与 0xe 也就是 14 比较,要求我们的这个参数必须小于等于 14 否则就炸了。
在 func4 函数之前存了三个寄存器,先列在下面。
1 2 3
| 40103a: ba 0e 00 00 00 mov $0xe,%edx 40103f: be 00 00 00 00 mov $0x0,%esi 401044: 8b 7c 24 08 mov 0x8(%rsp),%edi
|
这三个应该便是传进 func4 的参数,根据x86-64 传参规则,func4 的参数应该是
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
| 0000000000400fce <func4>: 400fce: 48 83 ec 08 sub $0x8,%rsp 400fd2: 89 d0 mov %edx,%eax 400fd4: 29 f0 sub %esi,%eax 400fd6: 89 c1 mov %eax,%ecx 400fd8: c1 e9 1f shr $0x1f,%ecx 400fdb: 01 c8 add %ecx,%eax 400fdd: d1 f8 sar %eax 400fdf: 8d 0c 30 lea (%rax,%rsi,1),%ecx 400fe2: 39 f9 cmp %edi,%ecx 400fe4: 7e 0c jle 400ff2 <func4+0x24> 400fe6: 8d 51 ff lea -0x1(%rcx),%edx 400fe9: e8 e0 ff ff ff callq 400fce <func4> 400fee: 01 c0 add %eax,%eax 400ff0: eb 15 jmp 401007 <func4+0x39> 400ff2: b8 00 00 00 00 mov $0x0,%eax 400ff7: 39 f9 cmp %edi,%ecx 400ff9: 7d 0c jge 401007 <func4+0x39> 400ffb: 8d 71 01 lea 0x1(%rcx),%esi 400ffe: e8 cb ff ff ff callq 400fce <func4> 401003: 8d 44 00 01 lea 0x1(%rax,%rax,1),%eax 401007: 48 83 c4 08 add $0x8,%rsp 40100b: c3 retq
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
| int func4(int edi, int esi, int edx) { int eax = edx; eax -= esi; int ecx = eax; ecx >>= 31; eax += ecx; eax >>= 1; ecx = eax + esi; if (ecx > edi) { edx = ecx - 1; eax = func4(edi, esi, edx); eax *= 2; return eax; } else { eax = 0; if(ecx < edi) { esi = ecx + 1; eax = func4(edi, esi, edx); eax = eax * 2 + 1; return eax; } else return eax; } }
|
由此可见,输入为7即可,第二个直接填0就可以了
phase5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
| 0000000000401062 <phase_5>: 401062: 53 push %rbx 401063: 48 83 ec 20 sub $0x20,%rsp 401067: 48 89 fb mov %rdi,%rbx 40106a: 64 48 8b 04 25 28 00 mov %fs:0x28,%rax 401071: 00 00 401073: 48 89 44 24 18 mov %rax,0x18(%rsp) 401078: 31 c0 xor %eax,%eax 40107a: e8 9c 02 00 00 callq 40131b <string_length> 40107f: 83 f8 06 cmp $0x6,%eax 401082: 74 4e je 4010d2 <phase_5+0x70> 401084: e8 b1 03 00 00 callq 40143a <explode_bomb> 401089: eb 47 jmp 4010d2 <phase_5+0x70> 40108b: 0f b6 0c 03 movzbl (%rbx,%rax,1),%ecx 40108f: 88 0c 24 mov %cl,(%rsp) 401092: 48 8b 14 24 mov (%rsp),%rdx 401096: 83 e2 0f and $0xf,%edx 401099: 0f b6 92 b0 24 40 00 movzbl 0x4024b0(%rdx),%edx 4010a0: 88 54 04 10 mov %dl,0x10(%rsp,%rax,1) 4010a4: 48 83 c0 01 add $0x1,%rax 4010a8: 48 83 f8 06 cmp $0x6,%rax 4010ac: 75 dd jne 40108b <phase_5+0x29> 4010ae: c6 44 24 16 00 movb $0x0,0x16(%rsp) 4010b3: be 5e 24 40 00 mov $0x40245e,%esi 4010b8: 48 8d 7c 24 10 lea 0x10(%rsp),%rdi 4010bd: e8 76 02 00 00 callq 401338 <strings_not_equal> 4010c2: 85 c0 test %eax,%eax 4010c4: 74 13 je 4010d9 <phase_5+0x77> 4010c6: e8 6f 03 00 00 callq 40143a <explode_bomb> 4010cb: 0f 1f 44 00 00 nopl 0x0(%rax,%rax,1) 4010d0: eb 07 jmp 4010d9 <phase_5+0x77> 4010d2: b8 00 00 00 00 mov $0x0,%eax 4010d7: eb b2 jmp 40108b <phase_5+0x29> 4010d9: 48 8b 44 24 18 mov 0x18(%rsp),%rax 4010de: 64 48 33 04 25 28 00 xor %fs:0x28,%rax 4010e5: 00 00 4010e7: 74 05 je 4010ee <phase_5+0x8c> 4010e9: e8 42 fa ff ff callq 400b30 <__stack_chk_fail@plt> 4010ee: 48 83 c4 20 add $0x20,%rsp 4010f2: 5b pop %rbx 4010f3: c3 retq
|
可以看到这个函数设置了一个“金丝雀值”,放在了 %rsp+24 这个地方,然后就相应的去找函数结尾的异或判断,发现下面从 4010d9 开始就都是判断的了,这些和题目关系不大,可以粗略的看一眼。
整体扫过来一眼,发现调用了两个函数,string_length 和 strings_not_equal 两个函数,都是在之前分析过的,这里就不重复了。发现 string_length 这个函数的返回值和 6 比较,相等才能继续,不相等就爆炸。那跳到相等的地方看, %eax 置 0 ,跳回 40108b 。
根据最前面几行我们可以判断一下,%rbx 里存的是我们输入的数据,这里我们输入的是abcdef,输出 %rbx 里的东西看看:
1 2
| (gdb) x/s $rbx 0x6038c0 <input_strings+320>: "abcdef"
|
没有问题。看一下这个语句:
1 2 3 4
| 40108b: 0f b6 0c 03 movzbl (%rbx,%rax,1),%ecx 40108f: 88 0c 24 mov %cl,(%rsp) 401092: 48 8b 14 24 mov (%rsp),%rdx 401096: 83 e2 0f and $0xf,%edx
|
将 %rbx + %rax 里的东西 0 扩展成 32 位以后存到 %ecx ,此时 %eax 里存的是 0 。然后一通寄存器转换,最后 0xf 和%rdx的低四字节进行与运算,只取低四位。输出一下 %rdx 里存的东西看看:
1 2
| (gdb) print $rdx $19 = 97
|
这里卡了挺久的,不过还好,后来突然想起来字符在计算机里以ASCII码的形式存储,刚刚取得是 %rdx 的最低四位,应该是输入的第一个字符的ASCII码,对照表看一下,a 的十进制ASCII码值确实是 97 。好了,继续向下。
看到一个地址 0x4024b0,输出看一下。
1 2
| (gdb) x/s 0x4024b0 0x4024b0 <array.3449>: "maduiersnfotvbylSo you think you can stop the bomb with ctrl-c, do you?"
|
这个字符串先放着,看看后面的:
1 2 3 4 5
| 401099: 0f b6 92 b0 24 40 00 movzbl 0x4024b0(%rdx),%edx 4010a0: 88 54 04 10 mov %dl,0x10(%rsp,%rax,1) 4010a4: 48 83 c0 01 add $0x1,%rax 4010a8: 48 83 f8 06 cmp $0x6,%rax 4010ac: 75 dd jne 40108b <phase_5+0x29>
|
将 ( %rdx + 0x4024b0 )里面低位的一个字节拿出来进行 32 位 0 扩展之后放进 %edx 里。 %dl 是 %edx 的低 8 位,放到 %rsp + %rax +16 这个地址。然后递增 %rax ,直到 %rax 里面的数为 6 的时候 (%rax 初始为 0 )结束循环。也就是说这个循环是把 6 个输入字符的ASCII码存到 %rsp+16 ,%rsp + 17 一直到 %rsp + 21。
1
| 4010ae: c6 44 24 16 00 movb $0x0,0x16(%rsp)
|
这句话意思是在 %rsp+22 这个地方放 0 ,根据前面是字符串我们可以判断这个 0 其实就是 ‘ ‘ \0 ‘ 的意思。往下,看见一个地址放到了 %esi 里,输出看看。
1 2
| (gdb) x/s 0x40245e 0x40245e: "flyers"
|
这是个啥?不急,继续往下看。%rdi 指向我们刚刚输入的第一个字符,然后调用strings_not_equal函数测两个字符串是不是相等。相等则继续,不相等则爆炸。后面就是测“金丝雀值”的语句,没啥好说的。
所以综合下,整个phase是要求输入一个有且只能有 6 位的字符串,在机器里以ASCII码的方式存储。我们把每个字符ASCII码的低 4 位拿出来当作下标,下标范围从 0 - 15 ,放到那个很长的字符串里去一一匹配,也就是需要去那个很长的字符串里找“flyers”六个字母:
仔细查正好是 16 个,一一对应 0123456789ABCDEF 。flyers 对着 9FE567,所以我们去ASCII码表里找哪六个字符的ASCII码的低四位分别是 9FE567。
9 == 1001
F == 1111
E == 1110
5 == 0101
6 == 0110
7 == 0111
然后自己对着ASCII码找就好了。我自己懒得找了,试了一下输入 ionefg ,可以通过。
phase6
不想做了,回头有空再做