从零开始写 OS 内核 - 加载可执行程序

Posted 2021-09-03 navi

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了从零开始写 OS 内核 - 加载可执行程序相关的知识，希望对你有一定的参考价值。

系列目录

序篇
准备工作
Bios 启动到实模式
GDT 与保护模式
虚拟内存初探
加载并进入 kernel
显示与打印
全局描述符表 GDT
中断处理
虚拟内存完善
实现堆和 malloc
第一个内核线程
多线程运行与切换
锁与多线程同步
进入用户态
进程的实现
系统调用
简单的文件系统
加载可执行程序
键盘驱动
运行 shell

exec 系统调用

有了前面几篇关于系统调用和文件系统的铺垫，本篇来实现 exec 系统调用，其实已经是万事俱备了。exec 的使用想必你应该熟悉，它在进程里调用后会读取给定的可执行文件，然后用这个文件里的程序覆盖当前 process 运行，这实际上就是完成了从磁盘上启动运行一个新程序的过程。

准备用户程序

首先我们需要准备几个用户程序，并将它们写入上一篇中我们定制的那个 naive_fs 磁盘镜像中去。我在项目里创建了一个 user 目录，并在里面也加了 user/src 目录存放用户程序的源文件，以及 user/prog 用以存放编译链接后的可执行二进制。例如我们可以简单地写一个用户程序：

int main(int argc, char** argv) {
    while (1) {}
}

它非常简单只是一个死循环。当然你也可以写一个打印功能的程序，不过这里需要先实现打印，注意这是用户态的打印，你必须在让 kernel 提供一个打印功能的系统调用，比如叫 print，供用户调用。我将这个功能封装在了 src/common/stdio.c 的 printf 函数里，它底层会使用 print 系统调用。这样类似于 C 标准库，它会被 link 到用户程序二进制里。

例如我写了一个用户程序 hello，里面用到了打印功能：

#include "common/common.h"
#include "common/stdio.h"
#include "syscall/syscall.h"

int main(uint32 argc, char* argv[]) {
  printf("start user app: hello\\n");
  printf("argc = %d\\n", argc);
  for (uint32 i = 0; i < argc; i++) {
    printf("argv[%d] = %s\\n", i, argv[i]);
  }

  return 0;
}

编译链接生成用户二进制程序后，就可以使用前一篇提到的 disk_image_writer 函数将它们写入磁盘镜像。

加载程序并 exec

接下来我们可以实现 exec 系统调用了，kernel 里的实现部分在 process_exec 函数。

首先是读取二进制文件，这里用到上一篇实现的文件系统的接口：

// Get elf binary file stat.
file_stat_t stat;
if (stat_file(path, &stat) != 0) {
  monitor_printf("Command %s not found\\n", path);
  return -1;
}

// Read elf binary file.
uint32 size = stat.size;
char* read_buffer = (char*)kmalloc(size);
if (read_file(path, read_buffer, 0, size) != size) {
  monitor_printf("Failed to load cmd %s\\n", path);
  kfree(read_buffer);
  return -1;
}

然后就是解析 elf 文件，这个在加载并进入 kernel里已经实现过，这里用 C 语言重写一下，看起来会更清楚一点，代码在 src/elf/elf.c，它会将 elf 程序的各个 section 加载到内存，然后返回程序的入口地址。

接下来就是废弃原来的 process 的所有资源，因为 exec 是占据式的，原来的程序会被完全替代。这里主要是两项工作：

清理原来 process 的所有 threads，除了当前 thread；
释放原来的 user 空间的所有虚拟内存；

然后创建一个新的 thread，并使之以我们刚加载的新的 elf 二进制的入口函数为 entry 开始运行，这个新的 thread 就是新程序开始运行的主线程。

至于当前的执行线程，在 process_exec 的结尾，会直接调用 schedule_thread_exit 函数进入消亡。

总结

本篇比较简单，主要是我们各项准备工作都已经做的很充分了，exec 的实现只是一个拼接工作。不过有一些细节还是要注意的，比如说 exec 的参数需要提前 copy 到内核中，然后再释放 user 空间的虚拟内存，因为传进来的参数原本是存储在 user 空间的，一旦释放了内存，后面就无法再访问这些参数了。

以上是关于从零开始写 OS 内核 - 加载可执行程序的主要内容，如果未能解决你的问题，请参考以下文章

从零开始写 OS 内核 - 键盘驱动

从零开始写 OS 内核 - 运行 shell

从零开始用C语言实现图片解码播放器(有源码)

在 OS 中，为啥可加载内核模块 (LKM) 不需要调用消息传递来进行通信？

从零开始配置vim(27)——代码片段

从我的16位引导加载程序加载内核