无标C语言本身是用什么语言写的?世界上第一个能执行的编译器是如何编译?
Posted C语言编程俱乐部
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了无标C语言本身是用什么语言写的?世界上第一个能执行的编译器是如何编译?相关的知识,希望对你有一定的参考价值。
这个问题很有意思:
C语言的编译器,是用C语言写的。
什么?C语言是用C语言写的,这不就是“鸡生蛋,蛋生鸡”的问题吗?
要让C语言编译通过,就需要一个C语言编译器。但是C语言编译器是用C写的。那么世界上第一个能执行的编译器,是如何编译的呢?
这种编译器也用语言本身写的特性,称之为“自举”。
奇怪的是,这么一个让我们纳闷的问题,却很少有人提到。似乎大神们觉得很自然,不屑于说明。
直到后来学到一些编译相关的技术,才慢慢了解到这件事的原委。原因不复杂,我简化一下表述:
1.首先,简化C语言的设计,只选择最最基本、不得不实现的功能,形成一个C语言的子集。我们可以叫它C0。
2.用汇编语言实现C0语言的编译器,由于C0功能很少,比较容易直接写一个编译器。
3.用C0语言去实现更多必要的功能,由于C0语言功能太弱,遇到不好写的地方可以用汇编来打补丁。最终你得到了一个改进版的C0语言,我们称之为C1。
4.用C1语言去继续实现更多C语言功能,不好写的地方继续用汇编打补丁。可以得到C2语言
5.用C2语言去继续实现更多C语言功能,不好写的地方继续用汇编打补丁。可以得到C3语言
6.以此类推……
7.到Cn语言的时候,你已经得到了一个足够接近C语言的编译器。
8.继续迭代一两次……
9.终于,你得到了一份C语言的编译器。而前面的从C0版到Cn-1 版的编译器,都可以扔掉了。
为什么要分N个步骤呢?主要还是为了解释C语言慢慢进化的历史过程。实际上不见得要分很多步,很多中间步骤只是代表了远古大神们迭代改进的过程。
如果大神足够神,可以更简化:
1.直接用汇编语言写一个C语言编译器。
2.然后再用C语言写一个C语言编译器的源码,用汇编版的编译器 编译这个C代码
3.即可得到一个可运行、可正常使用的编译器。
然后,那个用汇编语言写的版本就可以扔掉了。
如果你觉得这个故事有点意思,说明你可能是对编程感兴趣的人。
理解这个问题的关键,是认识到:编译器,只是读取文本文件(源代码),输出某种计算机编码(比如机器语言)的程序。
既然编译器也只是个普通的程序,那么就能用任何语言编写。
所以,理论上来讲,你可以用Python、Java或者Scratch来写个C语言编译器。
以上是关于无标C语言本身是用什么语言写的?世界上第一个能执行的编译器是如何编译?的主要内容,如果未能解决你的问题,请参考以下文章