使用正则表达式进行单词统计

Posted 不怕天黑

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用正则表达式进行单词统计相关的知识,希望对你有一定的参考价值。

 1 import java.io.BufferedReader;
 2 import java.io.File;
 3 import java.io.FileNotFoundException;
 4 import java.io.FileReader;
 5 import java.io.IOException;
 6 
 7 public class CodeCounter {
 8     
 9     static long normalLines = 0;
10     static long commentLines = 0;
11     static long whiteLines = 0;
12     
13     public static void main(String[] args) {
14         File f = new File("D:\\share\\JavaProjects\\TankWar1.9.11\\src");
15         File[] codeFiles = f.listFiles();
16         for(File child : codeFiles){
17             if(child.getName().matches(".*\\.java$")) {
18                 parse(child);
19             }
20         }
21         
22         System.out.println("normalLines:" + normalLines);
23         System.out.println("commentLines:" + commentLines);
24         System.out.println("whiteLines:" + whiteLines);
25         
26     }
27 
28     private static void parse(File f) {
29         BufferedReader br = null;
30         boolean comment = false;
31         try {
32             br = new BufferedReader(new FileReader(f));
33             String line = "";
34             while((line = br.readLine()) != null) {
35                 line = line.trim();
36                 if(line.matches("^[\\s&&[^\\n]]*$")) {
37                     whiteLines ++;
38                 } else if (line.startsWith("/*") && !line.endsWith("*/")) {
39                     commentLines ++;
40                     comment = true;    
41                 } else if (line.startsWith("/*") && line.endsWith("*/")) {
42                     commentLines ++;
43                 } else if (true == comment) {
44                     commentLines ++;
45                     if(line.endsWith("*/")) {
46                         comment = false;
47                     }
48                 } else if (line.startsWith("//")) {
49                     commentLines ++;
50                 } else {
51                     normalLines ++;
52                 }
53             }
54         } catch (FileNotFoundException e) {
55             e.printStackTrace();
56         } catch (IOException e) {
57             e.printStackTrace();
58         } finally {
59             if(br != null) {
60                 try {
61                     br.close();
62                     br = null;
63                 } catch (IOException e) {
64                     e.printStackTrace();
65                 }
66             }
67         }
68     }
69 
70 }

 

以上是关于使用正则表达式进行单词统计的主要内容,如果未能解决你的问题,请参考以下文章

请问怎么用R语言正则表达式统计文章的单词数和中文字数,不能用程序包?

使用正则表达式获取标签中的第一个单词

Java n种方式分割统计单词

词频统计-功能二

vim怎么正则查询一个词出现的次数

python 正则表达式