在 Linux 内核中从实模式转换到保护模式

Question

我目前正在研究操作系统的底层组织。为了实现这一点，我试图了解 Linux 内核是如何加载的。

我无法理解的是从 16 位（实模式）到 32 位（保护模式）的转换。它发生在 this file.

protected_mode_jump函数对后面执行的32位代码进行各种辅助计算，然后在CR0寄存器中启用PE位

    movl    %cr0, %edx
    orb $X86_CR0_PE, %dl    # Protected mode
    movl    %edx, %cr0

然后长跳转到32位代码：

    # Transition to 32-bit mode
    .byte   0x66, 0xea      # ljmpl opcode
2:  .long   in_pm32         # offset
    .word   __BOOT_CS       # segment

据我了解，in_pm32 是在 protected_mode_jump:

正下方声明的 32 位函数的地址

    .code32
    .section ".text32","ax"
GLOBAL(in_pm32)
    # some code
    # ...
    # some code
ENDPROC(in_pm32)

__BOOT_CS 扇区基数为 0（GDT 是预先设置的 here），所以这意味着偏移量应该基本上是 in_pm32 函数的绝对地址。

这就是问题所在。在机器代码生成期间，assembler/linker 不应该知道 in_pm32 函数的绝对地址，因为它不知道在实模式下它将被加载到内存中的什么位置（各种引导加载程序可以占用不同数量的space，实模式内核在引导加载程序之后加载。

此外，链接器脚本（setup.ld 在同一文件夹中）将代码的起点设置为 0，因此 in_pm32 地址似乎是从实模式开始的偏移量核心。它应该与 16 位代码一起工作，因为 CS 寄存器设置正确，但是当长跳转发生时，CPU 已经处于保护模式，因此相对偏移量不应该工作。

所以我的问题是：如果偏移量 (.long in_pm32) 是相对的，为什么保护模式 (.byte 0x66, 0xea) 中的长跳转会设置正确的代码位置？

看来我遗漏了一些非常重要的东西。

Answer 1

看来你的问题实际上是关于存储在下一行的偏移量如何工作，因为它是相对于段的开始，不一定是内存的开始：

 2:  .long   in_pm32         # offset

确实 in_pm32 是相对于 linker script 使用的偏移量。特别是链接描述文件有：

. = 0;
.bstext     : { *(.bstext) }
.bsdata     : { *(.bsdata) }

. = 495;
.header     : { *(.header) }
.entrytext  : { *(.entrytext) }
.inittext   : { *(.inittext) }
.initdata   : { *(.initdata) }
__end_init = .;

.text       : { *(.text) }
.text32     : { *(.text32) }

虚拟内存地址设置为零（随后为 495），因此人们会认为 .text32 部分中的任何内容都必须固定在低内存中。如果没有 protected_mode_jump:

中的这些说明，这将是一个正确的观察

    xorl    %ebx, %ebx
    movw    %cs, %bx
    shll    , %ebx
    addl    %ebx, 2f

[snip]

    # Transition to 32-bit mode
    .byte   0x66, 0xea      # ljmpl opcode
2:  .long   in_pm32         # offset
    .word   __BOOT_CS       # segment

末尾有一个手动编码的FAR JMP，用于设置CS选择器为32位代码描述符完成向 32 位保护模式的过渡。但要注意的关键是这些行：

    xorl    %ebx, %ebx
    movw    %cs, %bx
    shll    , %ebx
    addl    %ebx, 2f

这取 CS 中的值并将其左移 4 位（乘以 16），然后将其添加到标签 2f 中存储的值。这是将 real mode segment:offset 对转换为线性地址（在本例中与物理地址相同）的方式。标签 2f 实际上是这一行中的偏移量 in_pm32:

2:  .long   in_pm32         # offset

当这些指令完成后，FAR JMP 中的长字值 in_pm32 将通过添加线性调整（在运行时）当前实模式代码段的地址到值in_pm32。此 .long (DWORD) 值将替换为 (CS<<4)+in_pm32.

此代码旨在可重定位到任何实模式段。最终线性地址在 FAR JMP 之前的运行时间计算。这实际上是 self-modifying 代码。

在 Linux 内核中从实模式转换到保护模式

Transition from real to protected mode in the Linux kernel

x86

assembly

real-mode

protected-mode

linux-kernel