词法分析器Flex学习1 - Flex识别关键字
Posted bcbobo21cn
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了词法分析器Flex学习1 - Flex识别关键字相关的知识,希望对你有一定的参考价值。
以前曾写过2篇Flex和Bison入门应用的文章;
https://blog.csdn.net/bcbobo21cn/article/details/112343850
https://blog.csdn.net/bcbobo21cn/article/details/106193648
我只记得Flex是词法分析器,Bison是语法分析器;
只是一些入门的介绍,比较模糊了;来看一下Flex;
那Flex是不是可以输入一种语言的代码,识别出该语言的关键字;
我仔细复习了一下;原来Flex并不是词法分析器,而是它可以生成一段C语言代码,这段C语言代码是一个词法分析器;是这个样子的;
先来看Flex识别关键字;
Flex文件的结构,
定义(definations)
%%
规则(rules)
%%
代码(user code)
Flex文件的新手框架,
%
%
%%
%%
int main(int argc, char **argv)
yylex()
return 0;
int yywrap()
return 1;
参阅此,
手把手教程-lex与yacc/flex与bison入门(一)(使用windows环境)_D-Cierra的博客-CSDN博客_bison教程
由Flex文件生成一个C语言代码文件,此C语言代码文件是一个词法分析器;
Flex文件,
第二部分由多条规则(rule)组成,每条rule可以由pattern与action组成。
pattern使用正则表达式表示,含义为需要匹配的词的规则。
action使用代码表示,含义为成功匹配该词后执行的动作。
做一个Flex文件;
%
#include <stdio.h>
%
%%
([1-9]+[0-9]*)|[0] ECHO;
[0-9]+\\.[0-9]+
[a-zA-Z]+
.
%%
int main(int argc, char **argv)
yylex();
yywrap();
int yywrap()
return 1;
此文件生成的C语言代码将识别输入内容中的整数;我还不知道为什么又在%%之间包含了 [a-zA-Z]+ 这条;
生成C代码如下;
打开看一下此文件包含main函数,可以单独构建运行;
在VC6新建一个C++源文件;
然后构建;提示工作区什么的点OK就可;
构建时有2个错误,1000多行,isatty这行,注释掉;
400多行,unistd.h这行,注释掉;
然后可以构建成功;如果用gcc构建大约可以直接构建成功;
测试一下生成的exe;输入一段内容,回车后识别出了其中的整数,在下一行输出;
这就识别出了整数;
对于此文的计算器来说,
https://blog.csdn.net/bcbobo21cn/article/details/106193648
它的flex文件如下;
%
#include "b.tab.h"
int yylval;
%
%%
"+" return ADD;
"-" return SUB;
"*" return MUL;
"/" return DIV;
"|" return ABS;
[0-9]+ yylval=atoi(yytext);return NUMBER;
\\n return EOL;
%%
"+" return ADD;,这行是识别输入内容中的"+",return ADD 这句还不了解,是在什么地方执行了加法,有时间再看;"+"是pattern,return ADD;是action;
来识别一些汇编语言的关键字看一下;
%
int key=0;
%
KEY MOV|MOVSX|MOVZX|PUSH|POP|XCHG
%%
KEY printf("KEY ");key++;
.
%%
int main(int argc, char **argv)
yylex();
printf("KEY=%d",key);
yywrap();
int yywrap()
return 1;
在输入内容中识别 MOV|MOVSX|MOVZX|PUSH|POP|XCHG 这其中的一个;然后输出;
最终的exe运行如下;可以识别;输入一行内容,如果有关键字在下一行输出key,没有则输出空;区分大小写;直接输出识别到的关键字,可能是去掉printf("KEY=%d",key)这句;
有时间继续;
以上是关于词法分析器Flex学习1 - Flex识别关键字的主要内容,如果未能解决你的问题,请参考以下文章
编译原理实战——使用Lex/Flex进行编写一个有一定词汇量的词法分析器