VIM - 字数统计

Posted 2020-12-16 xy14

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了VIM - 字数统计相关的知识，希望对你有一定的参考价值。

概述
1. 使用 VIM 作简单字数统计
背景
1. 想做一个简单的字数统计
环境
1. OS
  1. win10
2. shell
  1. mintty-2.9.4

1. 需求

概述
1. 需求
需求
1. 统计文段内字符的数量
2. 支持自定义字符集

2. 方案1: vim 自带统计

概述
1. vim 自带方案
操作
1. 定位到文段内某行
2. vim 标准模式
3. 输入
```
g
ctrl + g
```

结果

在 vim 底部, 有统计信息

# 统计信息我后面讲
Col 16-15 of 39-31; Line 38 of 102; Word 72 of 189; Char 389 of 1232; Byte 565 of 1862

统计信息
1. Col 16-15 of 39-31
  1. 列信息
    1. 注意
      1. 因为这一列有中文, 所以会出现这种情况
      2. 没有中文, 大概会是这样 Col 16 of 39
        
        utf-8 中, 长度大于 1个字节的字符
    2. 解释: 不含中文 - Col 16 of 39
      1. 当前光标, 处在 16 列
      2. 当前行, 一共有 39 列
    3. 解释: 包含中文 - Col 16-15 of 39-31
      1. 当前光标, 在 16 列, 第 15 个字符
      2. 当前行, 一共有 39 列, 但是只有 31 个字符
2. Line 38 of 102
  1. 行信息
    1. 解释
      1. 本文一共 102 行
      2. 当前光标处在, 38 行
3. Word 72 of 189
  1. 单词信息
    1. 解释
      1. 本文一共 189 个单词
      2. 当前光标, 处在第 72 个单词
4. Char 389 of 1232
  1. 字符信息
    1. 略
  2. 注意
    1. 如果文本都是英文或者数字, 不会出现这个项
    2. 统计内容成谜
      1. utf-8 字符
      2. 字母
      3. 数字
      4. 换行
      5. 还有一个不知道的字符
        
        总要占一个
        
        但就是找不到
  3. 建议
    1. 除非是比较粗的统计, 不建议使用这个字段
      1. 字符集无法定义
      2. 全文内容
5. Byte 565 of 1862
  1. 字节信息
    1. 略
问题
1. 字符的数量, 可能会有偏差
  1. 比如中文之类的问题
2. 无法自定义字符集

3. 方案2: 替换1

概述
1. 尝试用 ex 命令行下的 s 命令

操作

vim 命令模式

输入命令

# 假设我只统计中文
:% s/[u4E00-u9FCC]//n

执行

结果
1. 结果
```
96 matches on 96 lines
```
2. 好像有些偏差
  1. ref 里可以显示匹配字符数
  2. 但是我这里显示不了
    1. 只有行数, 这个好像没什么用啊

4. 方案3: 替换2

概述
1. 继续尝试用 ex 命令行下的 s 命令

操作

vim 命令模式

输入命令

# 假设我只统计中文
:% s/[u4E00-u9FCC]/&/g

执行

结果
1. 可以正常统计
```
564 substitutions on 98 lines
```

后续

字符集

可以自己调整字符集

# 汉字
[u4E00-u9FCC]
# 汉字 和 数字
[u4E00-u9FCC0-9]
# 汉字, 数字, 大小写字母
[u4E00-u9FCC0-9A-Za-z]

性能
1. 这个我暂时没有考虑过
  1. 总感觉会慢上一些

ps

ref
1. 在 VIM 或者 Emacs 中，如何统计选中文本的字数（汉字）？
  1. 一个无名用户的回答
2. vim如何统计字数
  1. 百度知道, 难得有用

以上是关于VIM - 字数统计的主要内容，如果未能解决你的问题，请参考以下文章

latex在vim中的代码片段

使用Python读取markdown文件并统计字数

VIM 代码片段插件 ultisnips 使用教程

Countvectorize 统计大文件中的字数

使用 Spark 和 Scala 进行字数统计

JavaScript 实现textarea限制输入字数，输入框字数实时统计更新，输入框实时字数计算移动端bug解决