Linux实现简易的Shell命令行解释器

Posted 沐曦希

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux实现简易的Shell命令行解释器相关的知识,希望对你有一定的参考价值。

大家好我是沐曦希💕

文章目录

一、前言

前面学到了进程创建,进程终止,进程等待,进程替换,那么通过这些来制作一个简易的Shell命令行解释器。

首先这是与Shell的互动:

用下图的时间轴来表示事件的发生次序。其中时间从左向右。shell由标识为sh的方块代表,它随着时间的流逝从左向右移动。shell从用户读入字符串"ls"。shell建立一个新的进程,然后在那个进程中运行ls程序并等待那个进程结束。

然后shell读取新的一行输入,建立一个新的进程,在这个进程中运行程序 并等待这个进程结束。所以要写一个shell,需要循环以下过程:

1. 获取命令行
2. 解析命令行
3. 建立一个子进程(fork)
4. 替换子进程(execvp)
5. 父进程等待子进程退出(wait)

二、准备工作

1.输出提示符


这里的提示字符为用户名@主机名 当前路径# 直接打印出来作为提示所用

printf("用户名@主机名 当前路径#");

这里没有\\n,会有缓冲区的问题,类似于我们之前所说的进度条所遇到的问题,可以用fflush(stdout)刷新缓冲区。

2.输入和获取命令

  • 输入

我们需要输入一连串命令,其中可能出现空格,所以不能使用gets函数,需要用到fgets函数,同时,可以定义一个lineCommand[NUM]数组

#define NUM 1024
char lineCommand[NUM];
char* s = fgets(lineCommand,sizeof(lineCommand) - 1, stdin);
assert(s != NULL);

但是打印的时候却多换了一行,这是我们把\\n也读取到了,直接进行处理即可,清除最后一个\\n

lineCommand[strlen(lineCommand) - 1] = 0;

可以通过打印看看效果和测试是否有BUG

printf("test:%s\\n",lineCommand);

  • 获取

输入之后,我们自然需要去进行获取,我们需要分割命令行,这个地方用strtok。把字符串切割成若干个子串:
strtok:第一次直接传递参数,第二次则必须传NULL。且在最终strtok会返回NULL。

3.shell运行原理

同时,在理解一下shell的运行原理:shell内部提取命令行做分析,然后调用exec. shell执行命令必须通过创建子进程,如果不创建子进程会把我们所有的shell全部替换,所以执行命令时一般磁盘上的程序必须创建子进程。

4.内建命令

我们在运行自己写的shell的时候,发现输入cd …输入cd path等命令时发现路径并没有改变!

没有发生改变是因为自己写的shell执行很多命令都要fork()创建子进程,让子进程执行的cd,子进程有自己的工作目录,所以更改的子进程的目录,子进程执行完毕,继续用的是父进程,既shell,并没有影响父进程,所以并没有改变。

对于cd,我们可以采用内建命令:不需要创建子进程执行,让shell自己执行命令,称为内建命令。本质就是执行系统接口,我们可以调用一个系统接口chdir,可解决上述问题:

5.替换

采用execvp进行替换进程

pid_t id = fork();
assert(id != -1);
if(id == 0)

	execvp(myargv[0],myargv);
	exit(1);

三、整体代码

#include<stdio.h>
 #include<stdlib.h>
 #include<unistd.h>
 #include<sys/types.h>
 #include<sys/wait.h>
 #include<assert.h>
 #include<string.h>
 #define NUM 1024
 #define OPT_NUM 64
 char lineCommand[NUM];
 char *myargv[OPT_NUM];//指针数组
 int lastcode = 0;
 int lastsig = 0;
 int main()
 
     while(1)
     
         // 1.输出提示符
         printf("lj@VM-8-2-centos 当前路径#");
         fflush(stdout);
         // 2.获取用户输入的命令,输入的时候,用户最后还输入了\\n
         char* s = fgets(lineCommand,sizeof(lineCommand) - 1, stdin);
         assert(s != NULL);
         (void)s; //避免Linux认为s变量未使用,导致警告
         // 清除最后一个\\n;例如:abcd\\n
         lineCommand[strlen(lineCommand) - 1] = 0;
         //printf("test:%s\\n",lineCommand);
         // "ls -a -l -i" -->字符串分割-->"ls" "-a" "-l" "-i"
         myargv[0] = strtok(lineCommand, " ");
         int i = 1;
         if(myargv[0] != NULL && (strcmp(myargv[0],"ls") == 0))
         
             myargv[i++] = (char*)"--color=auto";
         
         //如果没有子串了,strtok会返回NULL,即myargv[end] = NULL
         while(myargv[i++] = strtok(NULL," "));
         //如果是cd命令,不需要创建子进程,让shell自己执行对应的命令,本质就是执行系统接口
         //像这种不需要让我们的子进程来执行,而是让shell自己执行的命令—内建命令
         //其中echo是一个自建命令
         if(myargv[0] != NULL && (strcmp(myargv[0],"cd") == 0))
         
             if(myargv[1] != NULL) chdir(myargv[1]);
             continue;
         
         if(myargv[0] != NULL && myargv[1] != NULL && (strcmp(myargv[0],"echo") == 0))
         
             if(strcmp(myargv[1],"$?") == 0)
             
                 printf("%d,%d\\n",lastcode,lastsig);
             
             else
             
                 printf("%s\\n",myargv[i]);
             
             continue;
         
         //利用条件编译测试是否成功
 #ifdef DEBUG
         for(int i = 0; myargv[i]; ++i)
         
             printf("myargv[%d]:%s\\n",i,myargv[i]);
         
 #endif
         //执行命令
         pid_t id = fork();
         assert(id != -1);
         if(id == 0)
         
             execvp(myargv[0],myargv);
             exit(1);
         
         int status = 0;
         pid_t ret = waitpid(id,&status,0);
         assert(ret > 0);
         (void) ret;
         lastcode = (status >> 8) & 0xFF;
         lastsig = status & 0x7F;
     
     return 0;
 

Linux小练习模拟简易的shell

文章目录


一、前言

shell是命令行解释器,作用是将命令交给bash去执行,而bash将任务交给子进程来完成,这样即使这个任务出现问题,bash也不会受到影响。

而子进程也不是直接去执行任务,而是通过程序替换来完成,所以shell的模拟最重要的两个部分就是创建子进程和程序替换。

创建子进程在 进程概念 中已经提到过,下面先重点介绍进程替换,再模拟实现shell。


二、进程程序替换

1.替换原理

用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。


2.替换函数


函数都以exec开头,后面的字母可以采用如下的理解来记忆
l(list) : 表示采用参数列表
v(vector) : 表示参数用数组
p(path) : 表示在环境变量中搜索程序的路径
e(env) : 表示参数中自定义环境变量

由上可以看出,这6个函数使用时差别不是很大,以execl为例详细讲解。


int execl(const char *path, const char *arg, …);

path是程序的路径,arg是如何执行,“…”是可变参数,必须以NULL结尾。下面举一个例子。

先查看到ls的路径。

#include <stdio.h>
#include <unistd.h>

int main()

	printf("I am a process!\\n");
	sleep(3);
	//		路径 		  ls		命令行参数	以NULL结尾
	execl("/usr/bin/ls", "ls", "-a", "-i", "-l", NULL);
	return 0;

最后程序的结果显然与动图中上面运行ls -a -i -l的结果相同。

这样在我写的myproc进程内就可以调用其他的程序(比如ls)。


进程替换不会创建新的进程,直接用新的代码和数据替换原来的代码和数据,所以进程替换后的代码不会执行,直接被替换了。

#include <stdio.h>
#include <unistd.h>

int main()

	printf("I am a process!\\n");
	sleep(3);
	execl("/usr/bin/ls", "ls", "-a", "-i", "-l", NULL);
	printf("you can't see me!\\n");//看看这句代码是否被执行
	return 0;

结果没有打印you can’t see me!,所以可验证上面的结论。


程序替换也是可能失败的,下面以路径错误为例看结果。

#include <stdio.h>
#include <unistd.h>

int main()

	printf("I am a process!\\n");
	sleep(3);
	//正确路径这里是usr/bin/ls
	execl("/us/bin/ls", "ls", "-a", "-i", "-l", NULL);
	printf("you can't see me!\\n");//看看这句代码是否被执行
	return 0;


因为进程替换失败,所以后面的代码和数据都不会被替换,继续跑下面的代码。

所以说,exec系列的函数从使用上来说不需要判断返回值,只要返回就是失败。


一般调用exec系列的函数,多是创建子进程,然后将子进程的代码和数据替换掉,执行其他的程序。与上面的代码功能相同,新的代码如下。

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <stdlib.h>

int main()

	pid_t id = fork();
	if (id == 0)
	
		printf("I am a process!\\n");
		sleep(3);
		execl("/usr/bin/ls", "ls", "-a", "-i", "-l", NULL);
		exit(10);
	
	int status = 0;
	pid_t ret = waitpid(id, &status, 0);
	if (ret > 0 && WIFEXITED(status))
	
		printf("signal:%d\\n", WIFEXITED(status));
		printf("exit code:%d\\n", WEXITSTATUS(status));
	
	return 0;


下面是几个不需要环境变量的函数的等价写法。


三、模拟简易的shell

先以ls为例说明一下shell的大概流程。

用下图的时间轴来表示事件的发生次序。其中时间从左向右。shell由标识为sh的方块代表,它随着时间的流逝从左向右移动。

shell从用户读入字符"ls",然后建立一个新的子进程,接着在新创建的进程中运行ls程序并等待那个进程结束。

然后shell读取新的一行输入,建立一个新的进程,在这个进程中运行程序 并等待这个进程结束。

所以要写一个shell,需要循环以下过程:

  1. 获取命令行
  2. 解析命令行
  3. 建立一个子进程(fork)
  4. 替换子进程(exec)
  5. 父进程等待子进程退出(wait)

1.gethostname

首先命令行前有如下的提示符:

这些内容可以通过gethostname来获取。

用如下代码获取主机名:

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <stdlib.h>

int main()

	char name[100];
	while (1)
	
		gethostname(name, sizeof(name));
		printf("%s\\n", name);
	
	return 0;


在下面的代码中,直接用我自己虚构的主机名带代表模拟的shell。


2.模拟实现

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <stdlib.h>
#include <string.h>

#define LEN 1024//读入的字符个数最多1024个
#define NUM 32//命令+命令行参数最多32个

int main()

	char cmd[LEN];
	while (1)
	
		//打印提示符
		printf("[yh@my_centos dir]& ");

		//获得用户输入(其实就是一个字符串)
		fgets(cmd, LEN, stdin);//从标准输入(一般是键盘)读入用户输入的字符串
		cmd[strlen(cmd) - 1] = '\\0';//最后一个位置本来是'\\n'

		//解析字符串
		char* myArg[NUM];
		//输入的字符串至少有第一个命令
		myArg[0] = strtok(cmd, " ");//以空格为分割符先分割出命令
		int i = 1;
		//拿到之后的命令行参数
		while (myArg[i] = strtok(NULL, " "))//默认从上一次的子串中提取,所以传NULL
		
			i++;
		

		//让子进程执行命令
		pid_t id = fork();
		if (id == 0)
		
			//child
			execvp(myArg[0], myArg);
			exit(11);
		

		int status = 0;
		pid_t ret = waitpid(id, &status, 0);
		if (ret > 0 && WIFEXITED(status))
		
			printf("signal:%d,", WIFEXITED(status));
			printf("exit code:%d\\n", WEXITSTATUS(status));
		
	
	return 0;


但也有一些命令不能实现,比如用’;‘隔开的两个命令、使用’|'管道时、cd等命令等等,有些是因为程序中处理字符串时没有考虑、有些是因为命令本身不是由fork完成的。

这里模拟实现shell只是为了将fork和进程替换用起来,所以难免会有缺陷。


感谢阅读,如有错误请批评指正

以上是关于Linux实现简易的Shell命令行解释器的主要内容,如果未能解决你的问题,请参考以下文章

linux初学 :简易的shell脚本

Linux系统基本操作命令 -1

linux命令行与shell脚本编程大全---bash shell命令

命令行基础

linux下的shell命令,命令行,终端运行概念的解释???

linux下实现简易shell