且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

汇编语言(2)

更新时间:2022-08-12 16:13:41

汇编语言

向屏幕输出文字

  • 向屏幕输出需要向显示缓冲区写数据(在dosbox中在内存的其实位置是0b800h:0000h)
  • 输出的一个字符其实占用的是两个字节(一个字单位), 因为我们不仅要输出一个8位的ASCII, 还要输出该字符的属性, 包括高亮, 颜色, 底色等, 这些有另一个8位决定, 通过这8位指定一些数据显示
  • 屏幕上的每一个位置都在显示缓存区中有对应的位置, 要想在对应的位置显示字符我们只需要在对应的位置写一个字单位即可

汇编语言中的段

  • 我们所有可以看到的东西(数据)都放在data segment中, 而具体的操作放在code segement
  • 寄存去就相当于变量但是是有限的, 所以堆栈特别的重要

转移指令

  • 修改CS或者IP寄存器的值的都为转移指令
  • ret, call, jmp, loop都为转移指令
  • ret: 相当于pop ip, 虽然不能使用
  • ref: pop ip, pop cs
  • call: 相当于push ip, jmp near ptr label

nasm和ld命令在macOS上的使用

  • nasm -f macho64 demo.asm
  • ld -e _start demo.o -o demo

实模式下的中断向量表

  • 在实模式下的CPU在遇到除法溢出(0), int(4), 单步调试等内中断时到0000:0000起开的1KB之内寻找中断向量, 这个范围就是中断向量表, 该表有256个中断向量, 其实说是表示, 其实是没有index的, 而是CPU通过根据得到的中断号自己 N * 4, N * 4 + 2计算出两个字单元的位置, 读取该内存地址的值(该值就是中断处理程序的入口地址, 也就是等会儿要设置给CS和IP寄存器的值), CPU会去执行这个地址所指向的处理程序, 一般来说BIOS默认已经安装了一些处理程序了的, 我们可以覆盖或者添加自己的程序, 只需要在0000:0000开始的1KB中对象中断号的位置输入自己写的处理程序的入口地址, 让CPU可以找到即可(注意: 我们的处理程序要放在不会被覆盖的地方), 对于Linux来说, Linus在用完BIOS提供的功能之后将将中断向量表完全重写了, 而DOS就没有完全重写, 在实模式下0x80表示系统中断, 虽然现在的OS都是运行在保护模式下的(保护模式下没有中断向量表了), 但是在早期的WIndows 2.0中就是运行在实模式下的, int 0x80就是系统调用号, 128 * 4, 128 * 4 + 2 计算得出了在中断向量表中的CS和IP, 将该值读取到CS和IP中(注意: 在执行int指令时, 我们需要保存原来的CS和IP, 但是int指令通过硬件已经帮我们完成了), CPU执行安装在内存某处的一个处理程序, 该程序就是syscall的总入口, 可以这样理解, 在syscall中有很多的if-else, 通过控制寄存器中的值, 判断用户是调用了read, write还是fork等系统调用, 执行完毕之后返回return_from_syscall

保护模式

  • 没有了实模式下的中断向量表
  • Intel x80386为了兼容老式机还是提供了实模式, 所以计算机进入时默认进入的是实模式, 要想进入保护模式需要一些数据结构和准备工作
    • OS开发人员实现一个GDT(IDT不是必须的)
    • 将GDT的地址存放到GDTR中
    • 将r0寄存器中的pe位的值改为1, pe: protect enable
    • 开始一个叫A什么的总线
    • over
  • 保护模式下的中断通过中断号, IDTR, IDT, GDTR,GDT完成, 比实模式要复杂的多

32位与64位寄存器名称的差别

  • 32位的eax在64为中是rax, 一次类推