有没有更简洁的方法来获取每行的最后 N 个字符？

Posted 2023-03-15

技术标签:

【中文标题】有没有更简洁的方法来获取每行的最后 N 个字符？【英文标题】：Is there a cleaner way of getting the last N characters of every line? 【发布时间】：2014-08-17 02:22:34 【问题描述】：

为了简化讨论，让N = 3。

我目前提取文件或流中每一行的最后三个字符的方法是使用sed 捕获组中的最后三个字符并将整行替换为该组。

sed 's/^.*\(.\3\\)/\1/'

它可以工作，但似乎过于冗长，尤其是当我们与获取一行中的前三个字符的方法进行比较时。

cut -c -3

有没有更简洁的方法来提取每行的最后 N 个字符？

【问题讨论】：

@PeterSchneider 这将删除最后 3 个字符，而不是保留它们。 @Barmar 确实！我看错了问题。 @Barmar，我稍微修改了这个问题。我写的太具体了。 @Barmar，我目前正在测试下面答案的通用版本。 【参考方案1】：

grep -o '...$' 很简单：

cat /etc/passwd  | grep -o '...$'
ash
/sh
/sh
/sh
ync
/sh
/sh
/sh

或者更好：

N=3; grep -o ".\$N\$" </etc/passwd
ash
/sh
/sh
/sh
ync
/sh
/sh

这样您就可以将N 调整为您喜欢的任何值。

【讨论】：

这个答案在一般情况下也适用于egrep -o '.3$'。时间到了我会接受的。 :) @merlin2011 这将丢弃少于 3 个字符的行。如果这是您想要的行为，很好，否则，您可能需要考虑 .1,3$。仅供参考，` egrep -o '。3$` 需要连续 3 次相同的字符，所以它不能推广到这种情况 @Jezzamon 不，它没有，它需要任何 3 个字符。 egrep 已弃用，取而代之的是 grep -E 顺便说一句。【参考方案2】：

rev /path/file | cut -c -3 | rev

【讨论】：

我也喜欢这个答案，因为我几乎忘记了转速。 +1！稍后我还将对两者进行基准测试，看看双反转是否比正则表达式更快。用 3 个 shell 命令替换单个 sed 'verbose' 会使用更多资源，这不是有点笨吗？不，更容易记住。我同意@NeronLeVelu，这不是cleaner 的方式。【参考方案3】：

当它是一个很小的命令时，为什么要强调简洁？普遍性更为重要：

$ cat file
123456789
abcdefghijklmn

从第 4 个字符开始打印 3 个字符：

$ awk 'print substr($0,4,3)' file
456
def

从倒数第四个字符开始打印 3 个字符：

$ awk 'print substr($0,length($0)-3,3)' file
678
klm

要从每行中间的 [周围] 打印 3 个字符：

$ awk 'print substr($0,(length($0)-3)/2,3)' file
345
efg

【讨论】：

如何将其保存到变量中？您是在问 1) 如何将 awk 命令的输出保存到 shell 变量中，还是 2) 如何将子字符串保存到 awk 变量中，或者 3) 其他？我说的是 1。不过我找到了...f_id="$(echo $filename | awk 'print substr($0,length($0)-5,2)')" 请注意：length($0) 仅相当于 length 是的，我知道，我只是发现添加 4 个额外的字符更清晰。我可以接受length()，但是你只需要节省2个字符，而不是明确说明你得到的长度，$0，所以这似乎不值得权衡，我讨厌length，因为它看起来像一个变量和它的变体是一个非常常见的变量名称（即我们经常必须将一些字符串或数组的长度保存在一个变量中）。【参考方案4】：

纯 bash 解决方案：

$ while read -r in; do echo "$in: -3"; done
hello
llo
$

sed

$ sed 's,.*\(.\3\\)$,\1,'
hallo
llo
$

【讨论】：

以上是关于有没有更简洁的方法来获取每行的最后 N 个字符？的主要内容，如果未能解决你的问题，请参考以下文章

是否有更简洁的方法来获取错误和 Promise 的结果 [重复]

js怎样获取某个特殊字符最后出现的位置

使用 Linq 获取集合的最后 N 个元素？

有没有一种更简洁的方法来获得第一次出现的东西？

从R中的字符串中提取最后n个字符