如何使用 cut 为分隔符指定更多空格?
Posted
技术标签:
【中文标题】如何使用 cut 为分隔符指定更多空格?【英文标题】:How to specify more spaces for the delimiter using cut? 【发布时间】:2011-10-31 20:19:16 【问题描述】:有没有办法用 cut 命令为更多空格指定字段分隔符? (如“”+)? 例如:在下面的字符串中,我想达到值'3744',我应该说什么字段分隔符?
$ps axu | grep jboss
jboss 2574 0.0 0.0 3744 1092 ? S Aug17 0:00 /bin/sh /usr/java/jboss/bin/run.sh -c example.com -b 0.0.0.0
cut -d' '
不是我想要的,因为它只适用于一个空格。
awk
也不是我要找的,但是'cut'怎么办?
谢谢。
【问题讨论】:
最佳答案是使用tr
,如下所示:***.com/a/4483833/168143
与被问到的实际问题没有直接关系,但你可以使用pgrep
代替ps
+grep
,它在大多数现代发行版中都可用。它将完全按照您需要的形式返回结果。
How to make the 'cut' command treat multiple characters as one delimiter?的可能重复
【参考方案1】:
更短/更简单的解决方案:使用cuts
(减少我写的类固醇)
ps axu | grep '[j]boss' | cuts 4
请注意,cuts
字段索引是从零开始的,因此第 5 个字段指定为 4
http://arielf.github.io/cuts/
甚至更短(根本不使用 cut)是:
pgrep jboss
【讨论】:
【参考方案2】:如果您想从 ps 输出中选择列,有什么理由不使用 -o?
例如
ps ax -o pid,vsz
ps ax -o pid,cmd
分配的最小列宽,无填充,只有单个空格字段分隔符。
ps ax --no-headers -o pid:1,vsz:1,cmd
3443 24600 -bash
8419 0 [xfsalloc]
8420 0 [xfs_mru_cache]
8602 489316 /usr/sbin/apache2 -k start
12821 497240 /usr/sbin/apache2 -k start
12824 497132 /usr/sbin/apache2 -k start
Pid 和 vsz 给定 10 个字符宽度,1 个空格字段分隔符。
ps ax --no-headers -o pid:10,vsz:10,cmd
3443 24600 -bash
8419 0 [xfsalloc]
8420 0 [xfs_mru_cache]
8602 489316 /usr/sbin/apache2 -k start
12821 497240 /usr/sbin/apache2 -k start
12824 497132 /usr/sbin/apache2 -k start
在脚本中使用:-
oldpid=12824
echo "PID: $oldpid"
echo "Command: $(ps -ho cmd $oldpid)"
【讨论】:
【参考方案3】:我的方法是将 PID 存储到 /tmp 中的文件中,并使用 ssh
的 -S
选项找到正确的进程。这可能是一种滥用,但对我有用。
#!/bin/bash
TARGET_REDIS=$1:-redis.someserver.com
PROXY="proxy.somewhere.com"
LOCAL_PORT=$2:-6379
if [ "$1" == "stop" ] ; then
kill `cat /tmp/sshTunel$LOCAL_PORT-pid`
exit
fi
set -x
ssh -f -i ~/.ssh/aws.pem centos@$PROXY -L $LOCAL_PORT:$TARGET_REDIS:6379 -N -S /tmp/sshTunel$LOCAL_PORT ## AWS DocService dev, DNS alias
# SSH_PID=$! ## Only works with &
SSH_PID=`ps aux | grep sshTunel$LOCAL_PORT | grep -v grep | awk 'print $2'`
echo $SSH_PID > /tmp/sshTunel$LOCAL_PORT-pid
更好的方法可能是在终止之前查询SSH_PID
,因为该文件可能已过时并且会终止错误的进程。
【讨论】:
【参考方案4】:awk
版本可能是最好的方法,但如果你先用tr
挤压重复,你也可以使用cut
:
ps axu | grep jbos[s] | tr -s ' ' | cut -d' ' -f5
# ^^^^^^^^^^^^ ^^^^^^^^^ ^^^^^^^^^^^^^
# | | |
# | | get 5th field
# | |
# | squeeze spaces
# |
# avoid grep itself to appear in the list
【讨论】:
精美插图。tr -s ' '
非常好!我希望我能记得比awk
@Chris 我必须反对:D Awk 对这些事情更好!【参考方案5】:
作为替代方案,总是有 perl:
ps aux | perl -lane 'print $F[3]'
或者,如果您想获取从字段 #3 开始的所有字段(如上述答案之一所述):
ps aux | perl -lane 'print @F[3 .. scalar @F]'
【讨论】:
这不适用于lsof
的输出我试过lsof|perl -lane 'print $F[5]'
这有时会得到第 5 列,有时会得到第 6 列
我认为问题只是如何使用可能包含不同数量空格的分隔符。为此,答案是正确的。
在lsof中的问题是每行的列数并不总是一致的。
你可以使用这个答案:Get a certain column of an output with content aligned right and some columns not always filled【参考方案6】:
我仍然喜欢 Perl 处理带有空格的字段的方式。 第一个字段是 $F[0]。
$ ps axu | grep dbus | perl -lane 'print $F[4]'
【讨论】:
【参考方案7】:我将提名tr -s [:blank:]
作为最佳答案。
我们为什么要使用cut?它有一个神奇的命令,上面写着“我们想要第三个字段和之后的每个字段,省略前两个字段”
cat log | tr -s [:blank:] |cut -d' ' -f 3-
我不相信 awk 或 perl split 有一个等效的命令,我们不知道会有多少字段,即通过字段 X 输出第 3 个字段。
【讨论】:
【参考方案8】:实际上awk
正是您应该研究的工具:
ps axu | grep '[j]boss' | awk 'print $5'
或者您可以完全放弃grep
,因为awk
知道正则表达式:
ps axu | awk '/[j]boss/ print $5'
但是,如果出于某种奇怪的原因,你真的不能使用awk
,你可以做其他更简单的事情,比如先将所有空格折叠成一个空格:
ps axu | grep '[j]boss' | sed 's/\s\s*/ /g' | cut -d' ' -f5
顺便说一句,grep
技巧是一种仅获取 jboss
进程而不是 grep jboss
进程的巧妙方法(awk
变体也是如此)。
grep
进程将在其进程命令中包含文字 grep [j]boss
,因此不会被 grep
本身捕获,它正在寻找字符类 [j]
后跟 boss
。
这是避免某些人使用的| grep xyz | grep -v grep
范式的绝妙方法。
【讨论】:
很好的答案。下次我需要它时,我会回来再次查看它。grep
技巧似乎不适用于 crontab 文件。有什么原因吗?
我一直在学习并忘记了 grep 技巧。感谢我最近的提醒。也许这一次它会坚持下去。但我不会打赌。
@Michael,你应该在某个地方设置一个 cron 作业,每月一次将小费(可能还有其他人)邮寄给你 :-)
奥利弗,有时是“我如何用 Y 做 X?”的最佳答案。是“不要使用 Y,而是使用 Z”。由于 OP 接受了这个答案,我很可能让他们相信 :-)【参考方案9】:
我喜欢为此使用 tr -s 命令
ps aux | tr -s [:blank:] | cut -d' ' -f3
这会将所有空白压缩到 1 个空格。这种方式告诉 cut 使用空格作为分隔符是符合预期的。
【讨论】:
我认为这应该是答案,它更接近 OP 请求(要求使用 cut)。这种方法比 awk 方法慢 5-10%(因为还有一个管道需要用 tr 处理),但通常这无关紧要。【参考方案10】:如果必须使用 cut 命令的另一种方式
ps axu | grep [j]boss |awk '$1=$1'|cut -d' ' -f5
在 Solaris 中,将 awk 替换为 nawk
或 /usr/xpg4/bin/awk
【讨论】:
【参考方案11】:解决这个问题的一种方法是:
$ps axu | grep jboss | sed 's/\s\+/ /g' | cut -d' ' -f3
用一个替换多个连续的空格。
【讨论】:
奇怪,这在 OS X 上不起作用。sed 命令不会将多个空格变为一个空格。\s
是一个 GNU sed 扩展。在 OS X 上,您可以将 -E
标志传递给 sed 以启用扩展正则表达式,然后使用 [[:space:]]
代替 \s
,如下所示:sed -E 's/[[:space:]]+/ /g'
【参考方案12】:
就我个人而言,我倾向于将 awk 用于此类工作。例如:
ps axu| grep jboss | grep -v grep | awk 'print $5'
【讨论】:
可以压缩成ps axu | awk '/[j]boss/ print $5'
。
是不是awk慢了(特别是有一些多余的其他进程的时候),然后sed / grep / cut?以上是关于如何使用 cut 为分隔符指定更多空格?的主要内容,如果未能解决你的问题,请参考以下文章