生信笔记2-fastqc的安装和使用
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了生信笔记2-fastqc的安装和使用相关的知识,希望对你有一定的参考价值。
参考技术A fastqc是查看转录组数据质量的软件运行结束后生成两个文件一个.html网页文件,一个是.zip压缩文件,只看html网页文件就可以了
Filename:指的是进行质控的文件名
Encoding:指测序平台的版本和相应的编码版本号
Total Sequences:指reads的数量
Sequence length:指测序的长度
%GC 指整体序列中的GC含量
此图中的横轴是测序序列第1个碱基到第151个碱基
纵轴是质量得分,Q = -10*log10(error P)即20表示0.01的错误率,30表示0.001,纵轴值越高代表质量越好
图中红线表示中值
图中蓝色的细线是各个位置的平均值的连线
序列长度为51bp,那么这51个位置每个位置Q值的平均值就是这条reads的质量值
# 该图横轴是0-40,表示Q值
纵轴是每个值对应的reads数目
这个样本数据,测序结果主要集中在30-36中,证明测序质量很好!
横轴是1 - 51 bp;纵轴是百分比
图中四条线代表A T C G在每个位置平均含量
理论上来说,A和T应该相等,G和C应该相等,但是一般测序的时候,刚开始测序仪状态不稳定,很可能出现上图开头的情况。
横轴是0 - 100%; 纵轴是每条序列GC含量对应的数量
蓝色的线是程序根据经验分布给出的理论值,红色是真实值,两个应该比较接近才比较好
当测序仪器不能辨别某条reads的某个位置都是ATCG哪个碱基时,就会产生"N",对所有reads的每个位置统计N的比率。
每次测序仪测出来的长度在理论上应该是完全相等的,但是总会有一些偏差
比如此图中,51bp是主要的,但是还是有少量的50和52bp的长度
当测序的长度不同时,如果很严重,则表明测序仪在此次测序不成功
统计序列完全一样的reads的频率。横坐标是duplication的次数,纵坐标是duplicated reads的数目
横坐标为reads位置,纵坐标为Adapter序列占比;如果fastqc默认参数会将所有的常见的Adapter都列出
正常情况是趋于0的直线,也就是说序列两端Adapter已经去除干净;如果有Adapter,需要先用cutadapt去接头
https://www.jianshu.com/p/fe6af418a8bc
安装Fastqc软件遇到的坑
由于之前的HPC太难用了,所以决定搬家到十楼的工作站,于是就免不了配置必要的工作环境,其中一个少不了要安装的软件是就是fastqc,因为它太常用了。
我先是用conda安装,因为conda实在是太方便了,于是命令行:conda install fastqc 后面一路yes下去搞定,果然很顺利。
可是当我准备用的时候,输入命令: fastqc,诶?居然神奇吧的出错了,错误如下:
[email protected]:~/software/FastQC$ ./fastqc Exception in thread "main" java.awt.HeadlessException: No X11 DISPLAY variable was set, but this program performed an operation which requires it. at java.awt.GraphicsEnvironment.checkHeadless(GraphicsEnvironment.java:204) at java.awt.Window.<init>(Window.java:536) at java.awt.Frame.<init>(Frame.java:420) at java.awt.Frame.<init>(Frame.java:385) at javax.swing.JFrame.<init>(JFrame.java:189) at uk.ac.babraham.FastQC.FastQCApplication.<init>(FastQCApplication.java:63) at uk.ac.babraham.FastQC.FastQCApplication.main(FastQCApplication.java:332)
先是各种google,说是DISPLAY的设置问题,设置了一通都不成功。
于是回头看提示里跟java相关,我以为java安装有问题,所以查看了下java:
[email protected]:~/software/FastQC/Templates/Icons$ java -version openjdk version "1.8.0_121" OpenJDK Runtime Environment (Zulu 8.20.0.5-linux64) (build 1.8.0_121-b15) OpenJDK 64-Bit Server VM (Zulu 8.20.0.5-linux64) (build 25.121-b15, mixed mode)
java是安装了的,而且版本还很新,所以java环境应该没有问题。
又以为是conda安装有问题,所以自己安装看看:
自己按照说明安装Fastqc
[email protected]:~/software$ ls FastQC fastqc_v0.11.7.zip miniconda3 ref [email protected]:~/software$ cd FastQC/ [email protected]:~/software/FastQC$ ls cisd-jhdf5.jar fastqc Help jbzip2-0.9.jar LICENSE_JHDF5.txt net README.md RELEASE_NOTES.txt sam-1.103.jar uk Configuration fastqc_icon.ico INSTALL.txt LICENSE LICENSE.txt org README.txt run_fastqc.bat Templates
[email protected]:~/software/FastQC$ chmod 755 fastqc ----设置完毕
设置完毕后,运行fastqc看结果:
[email protected]:~/software/FastQC$ ./fastqc Exception in thread "main" java.awt.HeadlessException: No X11 DISPLAY variable was set, but this program performed an operation which requires it. at java.awt.GraphicsEnvironment.checkHeadless(GraphicsEnvironment.java:204) at java.awt.Window.<init>(Window.java:536) at java.awt.Frame.<init>(Frame.java:420) at java.awt.Frame.<init>(Frame.java:385) at javax.swing.JFrame.<init>(JFrame.java:189) at uk.ac.babraham.FastQC.FastQCApplication.<init>(FastQCApplication.java:63) at uk.ac.babraham.FastQC.FastQCApplication.main(FastQCApplication.java:332)
怎么会这样?......................
于是去群里找linux牛人,牛人看了一会之后,建议进入root 下输入如下命令:
[email protected]:~# echo $DESKTOP_SESSION
就问我说操作系统是不是没有桌面,我去问管理员,管理说是server,果然没有桌面!
原来没有安装桌面是java会报错呀!!!............
哎,既然是这个原因,就先让管理员装上图形界面吧,其它后面再说........
我至今都没搞明白为什么没有安装桌面,fastqc就不能正常运行。。。这个机理到底是神马?如果您知道麻烦请留言告诉我!
以上是关于生信笔记2-fastqc的安装和使用的主要内容,如果未能解决你的问题,请参考以下文章