生信笔记2-fastqc的安装和使用

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了生信笔记2-fastqc的安装和使用相关的知识,希望对你有一定的参考价值。

参考技术A fastqc是查看转录组数据质量的软件

运行结束后生成两个文件一个.html网页文件,一个是.zip压缩文件,只看html网页文件就可以了

Filename:指的是进行质控的文件名

Encoding:指测序平台的版本和相应的编码版本号

Total Sequences:指reads的数量

Sequence length:指测序的长度

%GC 指整体序列中的GC含量

此图中的横轴是测序序列第1个碱基到第151个碱基

纵轴是质量得分,Q = -10*log10(error P)即20表示0.01的错误率,30表示0.001,纵轴值越高代表质量越好

图中红线表示中值

图中蓝色的细线是各个位置的平均值的连线

序列长度为51bp,那么这51个位置每个位置Q值的平均值就是这条reads的质量值

# 该图横轴是0-40,表示Q值

纵轴是每个值对应的reads数目

这个样本数据,测序结果主要集中在30-36中,证明测序质量很好!

横轴是1 - 51 bp;纵轴是百分比

图中四条线代表A T C G在每个位置平均含量

理论上来说,A和T应该相等,G和C应该相等,但是一般测序的时候,刚开始测序仪状态不稳定,很可能出现上图开头的情况。

横轴是0 - 100%; 纵轴是每条序列GC含量对应的数量

蓝色的线是程序根据经验分布给出的理论值,红色是真实值,两个应该比较接近才比较好

当测序仪器不能辨别某条reads的某个位置都是ATCG哪个碱基时,就会产生"N",对所有reads的每个位置统计N的比率。

每次测序仪测出来的长度在理论上应该是完全相等的,但是总会有一些偏差

比如此图中,51bp是主要的,但是还是有少量的50和52bp的长度

当测序的长度不同时,如果很严重,则表明测序仪在此次测序不成功

统计序列完全一样的reads的频率。横坐标是duplication的次数,纵坐标是duplicated reads的数目

横坐标为reads位置,纵坐标为Adapter序列占比;如果fastqc默认参数会将所有的常见的Adapter都列出

正常情况是趋于0的直线,也就是说序列两端Adapter已经去除干净;如果有Adapter,需要先用cutadapt去接头

https://www.jianshu.com/p/fe6af418a8bc

安装Fastqc软件遇到的坑

由于之前的HPC太难用了,所以决定搬家到十楼的工作站,于是就免不了配置必要的工作环境,其中一个少不了要安装的软件是就是fastqc,因为它太常用了。

我先是用conda安装,因为conda实在是太方便了,于是命令行:conda install fastqc  后面一路yes下去搞定,果然很顺利。

可是当我准备用的时候,输入命令: fastqc,诶?居然神奇吧的出错了,错误如下:

[email protected]:~/software/FastQC$ ./fastqc 
Exception in thread "main" java.awt.HeadlessException: 
No X11 DISPLAY variable was set, but this program performed an operation which requires it.
    at java.awt.GraphicsEnvironment.checkHeadless(GraphicsEnvironment.java:204)
    at java.awt.Window.<init>(Window.java:536)
    at java.awt.Frame.<init>(Frame.java:420)
    at java.awt.Frame.<init>(Frame.java:385)
    at javax.swing.JFrame.<init>(JFrame.java:189)
    at uk.ac.babraham.FastQC.FastQCApplication.<init>(FastQCApplication.java:63)
    at uk.ac.babraham.FastQC.FastQCApplication.main(FastQCApplication.java:332)

先是各种google,说是DISPLAY的设置问题,设置了一通都不成功。

于是回头看提示里跟java相关,我以为java安装有问题,所以查看了下java:

[email protected]:~/software/FastQC/Templates/Icons$ java -version
openjdk version "1.8.0_121"
OpenJDK Runtime Environment (Zulu 8.20.0.5-linux64) (build 1.8.0_121-b15)
OpenJDK 64-Bit Server VM (Zulu 8.20.0.5-linux64) (build 25.121-b15, mixed mode)

java是安装了的,而且版本还很新,所以java环境应该没有问题。

又以为是conda安装有问题,所以自己安装看看:

自己按照说明安装Fastqc

[email protected]:~/software$ ls
FastQC  fastqc_v0.11.7.zip  miniconda3  ref
[email protected]:~/software$ cd FastQC/
[email protected]:~/software/FastQC$ ls
cisd-jhdf5.jar  fastqc           Help         jbzip2-0.9.jar  LICENSE_JHDF5.txt  net  README.md   RELEASE_NOTES.txt  sam-1.103.jar  uk
Configuration   fastqc_icon.ico  INSTALL.txt  LICENSE         LICENSE.txt        org  README.txt  run_fastqc.bat     Templates
[email protected]:~/software/FastQC$ chmod 755 fastqc ----设置完毕

设置完毕后,运行fastqc看结果:

[email protected]:~/software/FastQC$ ./fastqc 
Exception in thread "main" java.awt.HeadlessException: 
No X11 DISPLAY variable was set, but this program performed an operation which requires it.
    at java.awt.GraphicsEnvironment.checkHeadless(GraphicsEnvironment.java:204)
    at java.awt.Window.<init>(Window.java:536)
    at java.awt.Frame.<init>(Frame.java:420)
    at java.awt.Frame.<init>(Frame.java:385)
    at javax.swing.JFrame.<init>(JFrame.java:189)
    at uk.ac.babraham.FastQC.FastQCApplication.<init>(FastQCApplication.java:63)
    at uk.ac.babraham.FastQC.FastQCApplication.main(FastQCApplication.java:332)

怎么会这样?......................

于是去群里找linux牛人,牛人看了一会之后,建议进入root 下输入如下命令:

[email protected]:~# echo $DESKTOP_SESSION

就问我说操作系统是不是没有桌面,我去问管理员,管理说是server,果然没有桌面!

原来没有安装桌面是java会报错呀!!!............

哎,既然是这个原因,就先让管理员装上图形界面吧,其它后面再说........

我至今都没搞明白为什么没有安装桌面,fastqc就不能正常运行。。。这个机理到底是神马?如果您知道麻烦请留言告诉我!

以上是关于生信笔记2-fastqc的安装和使用的主要内容,如果未能解决你的问题,请参考以下文章

生信软件BUSCO安装

在Mac上探索MySQL的安装与使用

Bioinfo:学习Python,做生信PartII 学习笔记

Miniconda使用体验

生信软件的好帮手-bioconda--转载

生信分析常用脚本--SOAPdenovo