【awk】笔记
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了【awk】笔记相关的知识,希望对你有一定的参考价值。
参考技术A awk的参数-v (推荐)使用awk取某一行数据中的倒数第N列:$(NF-(n-1))
比如取/etc/passwd文件中的第2列、倒数第1、倒数第2、倒数第4列(以冒号为分隔符)
上述命令的意思是,如果第一列有重复,则保留最先出现的值;如果没有重复,则保留该值。( $1 表示第一列,如果想对第二列进行处理,则 $2 ,以此类推)如:
去除重复后:
如果事先通过排序,将想要的最优值排在前面,则去除重后,得到的即为最优值。
如有以下文件:
按第三列进行拆分:
需要将如下格式转换成“一个基因好对应一个 GO 号”
可以这样:
原理就是将所有的逗号 , 依次替换成 "\n"$1"\t" ;而不含有逗号的则照常打印出来。
即将文件 pta_go.annot 的格式转成文件 pta_go.txt 的格式
这里用到了三目运算符 ?: , ? 代表 是 ,而 : 代表 否 。如:
参考文章
R 语言 semi_join同样功能
参考资料
以上是关于【awk】笔记的主要内容,如果未能解决你的问题,请参考以下文章