shell脚本编程——用状态机统计一个txt文档的单词总数

Posted 每天告诉自己要努力

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了shell脚本编程——用状态机统计一个txt文档的单词总数相关的知识,希望对你有一定的参考价值。

这是我第一次遇见状态机这个概念(真的是纯小白入门),感受到实现状态迁移的模型思路的巧妙之处。

附上模型图
在这里插入图片描述
初始状态是INIT,假设文档里面所有字符除了字母则是分隔符,因此只要判断从分隔符变换到字母的次数即可统计出有多少个单词(这里遇到特殊情况会有bug,但是方便入门理解,先不考虑)。

附上代码(再次手敲一遍)

#include<stdio.h>
#define out  0
#define in   1
#define init out

int count_word(char *filename)
{
	int status = out;
	int word = 0;
	FILE *fp = fopen(filename,"r")//只读方式打开文件
	if (fp == NULL) 
	{printf("打开文件失败\\n");
	return -1;
	}
	
	char c;
	//死循环,只要不是文件末尾则会继续运行下去
	while ( (c = fgetc(fp)) != EOF)  //end of file
  {
	if ( c == "分隔符" ) //这里我偷懒了
	{
		status = out;
 	}
 	else if ( out = status )
 	{
 		status = in;
 		word ++;
    }
    return word;
  }
}

//argc 是 argument count的缩写,表示传入main函数的参数个数;argv 是 argument vector的缩写,表示传入main函数的参数序列或指针,并且第一个参数argv[0]一定是程序的名称,并且包含了程序所在的完整路径,所以确切的说需要我们输入的main函数的参数个数应该是argc-1个;

int main (int argc,char *argv[])
{
	if (argc < 2) return -1;
	printf("word: %d\\n" , count_word(argv[1]));
}

个人思考总结:状态机可以理解成,符合条件时,对应的状态机in,不符合条件时则为out。

以上是关于shell脚本编程——用状态机统计一个txt文档的单词总数的主要内容,如果未能解决你的问题,请参考以下文章

shell脚本统计文件中单词的个数

shell编程入门之成绩统计

使用shell脚本统计文件中ip出现的次数

利用shell脚本统计文件中出现次数最多的IP

Linux Shell编程实战---统计特定文件中单词的词频

⭐️ LeetCode解题系列 ⭐️ 192. 统计词频(Shell)