有没有更简洁的方法来获取每行的最后 N 个字符?

Posted

技术标签:

【中文标题】有没有更简洁的方法来获取每行的最后 N 个字符?【英文标题】:Is there a cleaner way of getting the last N characters of every line? 【发布时间】:2014-08-17 02:22:34 【问题描述】:

为了简化讨论,让N = 3

我目前提取文件或流中每一行的最后三个字符的方法是使用sed 捕获组中的最后三个字符并将整行替换为该组。

sed 's/^.*\(.\3\\)/\1/'

它可以工作,但似乎过于冗长,尤其是当我们与获取一行中的三个字符的方法进行比较时。

cut -c -3

有没有更简洁的方法来提取每行的最后 N 个字符?

【问题讨论】:

@PeterSchneider 这将删除最后 3 个字符,而不是保留它们。 @Barmar 确实!我看错了问题。 @Barmar,我稍微修改了这个问题。我写的太具体了。 @Barmar,我目前正在测试下面答案的通用版本。 【参考方案1】:

grep -o '...$' 很简单:

cat /etc/passwd  | grep -o '...$'
ash
/sh
/sh
/sh
ync
/sh
/sh
/sh

或者更好:

N=3; grep -o ".\$N\$" </etc/passwd
ash
/sh
/sh
/sh
ync
/sh
/sh

这样您就可以将N 调整为您喜欢的任何值。

【讨论】:

这个答案在一般情况下也适用于egrep -o '.3$'。时间到了我会接受的。 :) @merlin2011 这将丢弃少于 3 个字符的行。如果这是您想要的行为,很好,否则,您可能需要考虑 .1,3$ 仅供参考,` egrep -o '。3$` 需要连续 3 次相同的字符,所以它不能推广到这种情况 @Jezzamon 不,它没有,它需要任何 3 个字符。 egrep 已弃用,取而代之的是 grep -E 顺便说一句。【参考方案2】:
rev /path/file | cut -c -3 | rev

【讨论】:

我也喜欢这个答案,因为我几乎忘记了转速。 +1!稍后我还将对两者进行基准测试,看看双反转是否比正则表达式更快。 用 3 个 shell 命令替换单个 sed 'verbose' 会使用更多资源,这不是有点笨吗? 不,更容易记住。 我同意@NeronLeVelu,这不是cleaner 的方式。【参考方案3】:

当它是一个很小的命令时,为什么要强调简洁?普遍性更为重要:

$ cat file
123456789
abcdefghijklmn

从第 4 个字符开始打印 3 个字符:

$ awk 'print substr($0,4,3)' file
456
def

从倒数第四个字符开始打印 3 个字符:

$ awk 'print substr($0,length($0)-3,3)' file
678
klm

要从每行中间的 [周围] 打印 3 个字符:

$ awk 'print substr($0,(length($0)-3)/2,3)' file
345
efg

【讨论】:

如何将其保存到变量中? 您是在问 1) 如何将 awk 命令的输出保存到 shell 变量中,还是 2) 如何将子字符串保存到 awk 变量中,或者 3) 其他? 我说的是 1。不过我找到了...f_id="$(echo $filename | awk 'print substr($0,length($0)-5,2)')" 请注意:length($0) 仅相当于 length 是的,我知道,我只是发现添加 4 个额外的字符更清晰。我可以接受length(),但是你只需要节省2个字符,而不是明确说明你得到的长度,$0,所以这似乎不值得权衡,我讨厌length,因为它看起来像一个变量和它的变体是一个非常常见的变量名称(即我们经常必须将一些字符串或数组的长度保存在一个变量中)。【参考方案4】:

纯 bash 解决方案:

$ while read -r in; do echo "$in: -3"; done
hello
llo
$

sed

$ sed 's,.*\(.\3\\)$,\1,'
hallo
llo
$

【讨论】:

以上是关于有没有更简洁的方法来获取每行的最后 N 个字符?的主要内容,如果未能解决你的问题,请参考以下文章

是否有更简洁的方法来获取错误和 Promise 的结果 [重复]

js怎样获取某个特殊字符最后出现的位置

js怎样获取某个特殊字符最后出现的位置

使用 Linq 获取集合的最后 N 个元素?

有没有一种更简洁的方法来获得第一次出现的东西?

从R中的字符串中提取最后n个字符