在 Linux 内核中从实模式转换到保护模式
Transition from real to protected mode in the Linux kernel
我目前正在研究操作系统的底层组织。为了实现这一点,我试图了解 Linux 内核是如何加载的。
我无法理解的是从 16 位(实模式)到 32 位(保护模式)的转换。它发生在 this file.
protected_mode_jump
函数对后面执行的32位代码进行各种辅助计算,然后在CR0
寄存器中启用PE
位
movl %cr0, %edx
orb $X86_CR0_PE, %dl # Protected mode
movl %edx, %cr0
然后长跳转到32位代码:
# Transition to 32-bit mode
.byte 0x66, 0xea # ljmpl opcode
2: .long in_pm32 # offset
.word __BOOT_CS # segment
据我了解,in_pm32
是在 protected_mode_jump
:
正下方声明的 32 位函数的地址
.code32
.section ".text32","ax"
GLOBAL(in_pm32)
# some code
# ...
# some code
ENDPROC(in_pm32)
__BOOT_CS
扇区基数为 0(GDT 是预先设置的 here),所以这意味着偏移量应该基本上是 in_pm32
函数的绝对地址。
这就是问题所在。在机器代码生成期间,assembler/linker 不应该知道 in_pm32
函数的绝对地址,因为它不知道在实模式下它将被加载到内存中的什么位置(各种引导加载程序可以占用不同数量的space,实模式内核在引导加载程序之后加载。
此外,链接器脚本(setup.ld
在同一文件夹中)将代码的起点设置为 0,因此 in_pm32
地址似乎是从实模式开始的偏移量核心。它应该与 16 位代码一起工作,因为 CS
寄存器设置正确,但是当长跳转发生时,CPU 已经处于保护模式,因此相对偏移量不应该工作。
所以我的问题是:
如果偏移量 (.long in_pm32
) 是相对的,为什么保护模式 (.byte 0x66, 0xea
) 中的长跳转会设置正确的代码位置?
看来我遗漏了一些非常重要的东西。
看来你的问题实际上是关于存储在下一行的偏移量如何工作,因为它是相对于段的开始,不一定是内存的开始:
2: .long in_pm32 # offset
确实 in_pm32
是相对于 linker script 使用的偏移量。特别是链接描述文件有:
. = 0;
.bstext : { *(.bstext) }
.bsdata : { *(.bsdata) }
. = 495;
.header : { *(.header) }
.entrytext : { *(.entrytext) }
.inittext : { *(.inittext) }
.initdata : { *(.initdata) }
__end_init = .;
.text : { *(.text) }
.text32 : { *(.text32) }
虚拟内存地址设置为零(随后为 495),因此人们会认为 .text32
部分中的任何内容都必须固定在低内存中。如果没有 protected_mode_jump
:
中的这些说明,这将是一个正确的观察
xorl %ebx, %ebx
movw %cs, %bx
shll , %ebx
addl %ebx, 2f
[snip]
# Transition to 32-bit mode
.byte 0x66, 0xea # ljmpl opcode
2: .long in_pm32 # offset
.word __BOOT_CS # segment
末尾有一个手动编码的FAR JMP,用于设置CS选择器为32位代码描述符完成向 32 位保护模式的过渡。但要注意的关键是这些行:
xorl %ebx, %ebx
movw %cs, %bx
shll , %ebx
addl %ebx, 2f
这取 CS 中的值并将其左移 4 位(乘以 16),然后将其添加到标签 2f
中存储的值。这是将 real mode segment:offset 对转换为线性地址(在本例中与物理地址相同)的方式。标签 2f
实际上是这一行中的偏移量 in_pm32
:
2: .long in_pm32 # offset
当这些指令完成后,FAR JMP 中的长字值 in_pm32
将通过添加线性调整(在 运行 时)当前实模式代码段的地址到值in_pm32
。此 .long
(DWORD) 值将替换为 (CS<<4)+in_pm32.
此代码旨在可重定位到任何实模式段。最终线性地址在 FAR JMP 之前的 运行 时间计算。这实际上是 self-modifying 代码。
我目前正在研究操作系统的底层组织。为了实现这一点,我试图了解 Linux 内核是如何加载的。
我无法理解的是从 16 位(实模式)到 32 位(保护模式)的转换。它发生在 this file.
protected_mode_jump
函数对后面执行的32位代码进行各种辅助计算,然后在CR0
寄存器中启用PE
位
movl %cr0, %edx
orb $X86_CR0_PE, %dl # Protected mode
movl %edx, %cr0
然后长跳转到32位代码:
# Transition to 32-bit mode
.byte 0x66, 0xea # ljmpl opcode
2: .long in_pm32 # offset
.word __BOOT_CS # segment
据我了解,in_pm32
是在 protected_mode_jump
:
.code32
.section ".text32","ax"
GLOBAL(in_pm32)
# some code
# ...
# some code
ENDPROC(in_pm32)
__BOOT_CS
扇区基数为 0(GDT 是预先设置的 here),所以这意味着偏移量应该基本上是 in_pm32
函数的绝对地址。
这就是问题所在。在机器代码生成期间,assembler/linker 不应该知道 in_pm32
函数的绝对地址,因为它不知道在实模式下它将被加载到内存中的什么位置(各种引导加载程序可以占用不同数量的space,实模式内核在引导加载程序之后加载。
此外,链接器脚本(setup.ld
在同一文件夹中)将代码的起点设置为 0,因此 in_pm32
地址似乎是从实模式开始的偏移量核心。它应该与 16 位代码一起工作,因为 CS
寄存器设置正确,但是当长跳转发生时,CPU 已经处于保护模式,因此相对偏移量不应该工作。
所以我的问题是:
如果偏移量 (.long in_pm32
) 是相对的,为什么保护模式 (.byte 0x66, 0xea
) 中的长跳转会设置正确的代码位置?
看来我遗漏了一些非常重要的东西。
看来你的问题实际上是关于存储在下一行的偏移量如何工作,因为它是相对于段的开始,不一定是内存的开始:
2: .long in_pm32 # offset
确实 in_pm32
是相对于 linker script 使用的偏移量。特别是链接描述文件有:
. = 0;
.bstext : { *(.bstext) }
.bsdata : { *(.bsdata) }
. = 495;
.header : { *(.header) }
.entrytext : { *(.entrytext) }
.inittext : { *(.inittext) }
.initdata : { *(.initdata) }
__end_init = .;
.text : { *(.text) }
.text32 : { *(.text32) }
虚拟内存地址设置为零(随后为 495),因此人们会认为 .text32
部分中的任何内容都必须固定在低内存中。如果没有 protected_mode_jump
:
xorl %ebx, %ebx
movw %cs, %bx
shll , %ebx
addl %ebx, 2f
[snip]
# Transition to 32-bit mode
.byte 0x66, 0xea # ljmpl opcode
2: .long in_pm32 # offset
.word __BOOT_CS # segment
末尾有一个手动编码的FAR JMP,用于设置CS选择器为32位代码描述符完成向 32 位保护模式的过渡。但要注意的关键是这些行:
xorl %ebx, %ebx
movw %cs, %bx
shll , %ebx
addl %ebx, 2f
这取 CS 中的值并将其左移 4 位(乘以 16),然后将其添加到标签 2f
中存储的值。这是将 real mode segment:offset 对转换为线性地址(在本例中与物理地址相同)的方式。标签 2f
实际上是这一行中的偏移量 in_pm32
:
2: .long in_pm32 # offset
当这些指令完成后,FAR JMP 中的长字值 in_pm32
将通过添加线性调整(在 运行 时)当前实模式代码段的地址到值in_pm32
。此 .long
(DWORD) 值将替换为 (CS<<4)+in_pm32.
此代码旨在可重定位到任何实模式段。最终线性地址在 FAR JMP 之前的 运行 时间计算。这实际上是 self-modifying 代码。