python版的MCScan绘图
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python版的MCScan绘图相关的知识,希望对你有一定的参考价值。
参考技术A将gff转变为bed格式
获取对应cds/pep序列
也可以根据gff文件,基因组ref.fa文件中直接调取cds,和pep序列
得到以下图片
若想突出显示某一共线性则可以在对应的位置添加g *即可
若想比较3个物种共线性关系,则应两两比对,得到两个.simple文件,并对其进行配置
可以得到以下结果
也可以调整配置文件,得到不同样式的图形
得到如下结果
除此之外,可以用TBtools快速得到共线性图片可以参考 用TBtools,快速高效实现基因组共线性分析与可视化, 赞!
在基因水平上进行查看共线性结果
(1)获取共线性区块
grape.peach.i1.blocks 包含两列 (iter=1),第一列grape基因名字,第二列;peach基因名,么有对应基因就是一个点
本次选择部分进行画图
(2)配置画图 blocks.layout
(3) 进行画图
也可以选择直线
基因也可以只用箭头的方式
也可以添加颜色
添加基因名称
也可以多个进行比对(如上述一样)
首先俩俩进行比对,分别获取block,然后将其合并即可
block 文件如下
blocks2.layout如下
开始画
有散景版的熊猫自相关绘图方法吗?
【中文标题】有散景版的熊猫自相关绘图方法吗?【英文标题】:Is there a bokeh version of pandas autocorrelation plot method? 【发布时间】:2017-09-06 18:01:18 【问题描述】:假设我们有一个名为“series”的时间序列对象。我知道它很容易使用 autocorrelation_plot() 方法来绘制 series 对象的滞后和自相关维度。
代码如下:
from matplotlib import pyplot
from pandas.tools.plotting import autocorrelation_plot
autocorrelation_plot(series)
pyplot.show()
这是熊猫图:
有没有办法使用散景服务器获得相同的情节?
【问题讨论】:
【参考方案1】:是的,有。我编写的代码可以为您提供与 pandas autocorrelation_plot() 方法相同的结果。
代码如下:
from bokeh.layouts import column
from bokeh.plotting import figure, curdoc
import timeseries_model_creator # to get data
import numpy as np
TimeSeriesModelCreator = timeseries_model_creator.TimeSeriesModelCreator()
series = TimeSeriesModelCreator.read_csv() # time series object
def get_autocorrelation_plot_params(series):
n = len(series)
data = np.asarray(series)
mean = np.mean(data)
c0 = np.sum((data - mean) ** 2) / float(n)
def r(h):
return ((data[:n - h] - mean) *
(data[h:] - mean)).sum() / float(n) / c0
x = np.arange(n) + 1
y = map(r, x)
print "x : ", x, " y : ", y
z95 = 1.959963984540054
z99 = 2.5758293035489004
return n, x, y, z95, z99
n, x, y, z95, z99 = get_autocorrelation_plot_params(series)
auto_correlation_plot2 = figure(title='Time Series Auto-Correlation', plot_width=1000,
plot_height=500, x_axis_label="Lag", y_axis_label="Autocorrelation")
auto_correlation_plot2.line(x, y=z99 / np.sqrt(n), line_dash='dashed', line_color='grey')
auto_correlation_plot2.line(x, y=z95 / np.sqrt(n), line_color='grey')
auto_correlation_plot2.line(x, y=0.0, line_color='black')
auto_correlation_plot2.line(x, y=-z95 / np.sqrt(n), line_color='grey')
auto_correlation_plot2.line(x, y=-z99 / np.sqrt(n), line_dash='dashed', line_color='grey')
auto_correlation_plot2.line(x, y, line_width=2)
auto_correlation_plot2.circle(x, y, fill_color="white", size=8) # optional
curdoc().add_root(column(auto_correlation_plot2))
这是散景图:
【讨论】:
【参考方案2】:我基本上是在复制 Ayberk 的答案,但是把它变成了一个函数
def acf(series):
n = len(series)
data = np.asarray(series)
mean = np.mean(data)
c0 = np.sum((data - mean) ** 2) / float(n)
def r(h):
acf_lag = ((data[:n - h] - mean) * (data[h:] - mean)).sum() / float(n) / c0
return round(acf_lag, 3)
x = np.arange(n) # Avoiding lag 0 calculation
acf_coeffs = pd.Series(map(r, x)).round(decimals = 3)
acf_coeffs = acf_coeffs + 0
return acf_coeffs
def significance(series):
n = len(series)
z95 = 1.959963984540054 / np.sqrt(n)
z99 = 2.5758293035489004 / np.sqrt(n)
return(z95,z99)
def bok_autocor(series):
x = pd.Series(range(1, len(series)+1), dtype = float)
z95, z99 = significance(series)
y = acf(series)
p = figure(title='Time Series Auto-Correlation', plot_width=1000,
plot_height=500, x_axis_label="Lag", y_axis_label="Autocorrelation")
p.line(x, z99, line_dash='dashed', line_color='grey')
p.line(x, z95, line_color = 'grey')
p.line(x, y=0.0, line_color='black')
p.line(x, z99*-1, line_dash='dashed', line_color='grey')
p.line(x, z95*-1, line_color = 'grey')
p.line(x, y, line_width=2)
return p
show(series.pipe(bok_autocor))
我找到了 acf here,它表明它来自 pandas autocorrelation_plot 函数,并且看起来也与 Ayberk 使用的相似。
【讨论】:
以上是关于python版的MCScan绘图的主要内容,如果未能解决你的问题,请参考以下文章