Python热图:更改颜色图并使不对称

Posted

技术标签:

【中文标题】Python热图:更改颜色图并使不对称【英文标题】:Python heatmap: Change colour map and make asymmetrical 【发布时间】:2018-09-06 22:00:12 【问题描述】:

我想为这些数据建立一个热图:

curation1       curation2       overlap
1      2      0
1      3      1098
1      4      11
1      5      137
1      6      105
1      7      338
2      3      351
2      4      0
2      5      1
2      6      0
2      7      0
3      4      132
3      5      215
3      6      91
3      7      191
4      5      6
4      6      10
4      7      19
5      6      37
5      7      95
6      7     146

我用这段代码制作了一张热图:

import sys
import pandas as pd
import matplotlib
matplotlib.use('Agg')
import matplotlib.ticker as ticker
import matplotlib.cm as cm
import matplotlib as mpl
import matplotlib.pyplot as plt
from matplotlib.backends.backend_pdf import PdfPages
from matplotlib import colors

data_raw = pd.read_csv(sys.argv[1],sep = '\t')
data_raw["curation1"] = pd.Categorical(data_raw["curation1"], data_raw.curation1.unique())
data_raw["curation2"] = pd.Categorical(data_raw["curation2"], data_raw.curation2.unique())
data_matrix = data_raw.pivot("curation1", "curation2", "overlap")

fig = plt.figure()
fig, ax = plt.subplots(1,1, figsize=(12,12))
heatplot = ax.imshow(data_matrix,cmap = 'BuPu')
#ax.set_xticklabels(data_matrix.columns)
#ax.set_yticklabels(data_matrix.index)
tick_spacing = 1
#ax.xaxis.set_major_locator(ticker.MultipleLocator(tick_spacing))
#ax.yaxis.set_major_locator(ticker.MultipleLocator(tick_spacing))
ax.set_title("Overlap")
fig.savefig('output.pdf')

输出如下所示:

我有三个问题:

    您可以看到配色方案有点“偏离”,因为大多数数据的颜色都很浅,并且有一个随机的紫色框表示“0”。理想情况下,我希望这张热图是不同深浅的绿色,最深的绿色是最高的数字,最轻(但仍然清晰可见)的绿色是最低的数字。我试图玩弄'cmap'参数,例如如python教程here中所述将其更改为“冬季”;但我做错了什么。有人可以告诉我具体在哪里可以更改吗?

    彩条:我想加彩条,但我想我需要先理清问题1。

    不对称:如您所见,此图是不对称的。是否可以绘制热图的一半(例如,去掉不必要的线条,并可能将轴标签移动到图的右侧?;如果不是,这没什么大不了的,因为我可以重新夹具它在PowerPoint中)。

【问题讨论】:

【参考方案1】:

这将解决你的前两个问题 -

fig = plt.figure()
fig, ax = plt.subplots(1,1, figsize=(12,12))
heatplot = ax.imshow(data_matrix,cmap = 'Greens')

cbar = fig.colorbar(heatplot, ticks=[data_raw.overlap.min(), data_raw.overlap.max()])
tick_spacing = 1
ax.set_title("Overlap")

【讨论】:

这太棒了,谢谢,因为我可以在 powerpoint 中完成最后一部分。我对自己的 cmap 参数尝试如此接近感到恼火!谢谢。【参考方案2】:

我会改用seaborn heatmap 函数。颜色图Greens 应该可以解决您想要的配色方案。如果您愿意,可以查看matplotlib docs 中的其他选项。

只需 hihglight 和 ctrl + c 问题中的数据集,然后运行下面的 sn-p:

# Imports
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np

data_raw = pd.read_clipboard(sep='\\s+')
data_matrix = data_raw.pivot("curation1", "curation2", "overlap")
data_matrix = data_matrix.fillna(0)

# A heatmap function that builds on the seaborn heatmap function
def HeatMap_function(df, title, transpose = True, colors = 'Greens', dropDuplicates = True):

    if transpose:
        df = df.T
    
    if dropDuplicates:    
        mask = np.zeros_like(df, dtype=np.bool)
        mask = np.invert(mask)
        mask[np.triu_indices_from(mask)] = False

    # Set background color / chart style
    sns.set_style(style = 'white')

    # Set up  matplotlib figure
    f, ax = plt.subplots(figsize=(11, 9))
    ax.set_title(title)
  
    # Add diverging colormap from red to blue
    # cmap = sns.diverging_palette(250, 10, as_cmap=True)
    cmap=plt.get_cmap(colors)
    
    # Draw correlation plot with or without duplicates
    if dropDuplicates:
        sns.heatmap(df, mask=mask, cmap=cmap, 
                square=True,
                linewidth=.5, cbar_kws="shrink": .5, ax=ax)
    else:
        sns.heatmap(df, cmap=cmap, 
                square=True,
                linewidth=.5, cbar_kws="shrink": .5, ax=ax)

    ax.xaxis.set_ticks_position('top')
    ax.yaxis.set_ticks_position('right')

# A testrun
HeatMap_function(df = data_matrix, title = 'Overlap', transpose = False,
                 colors = 'Greens', dropDuplicates = True)

你会得到这个:

现在您还可以使用transposecolorsdropDuplicates 的不同组合来更改绘图布局。

【讨论】:

如果这是您认为可以使用的东西,我将在几行中进行编辑,以便在我找到时间时将其存储在活动的 powerpoint 演示文稿中。【参考方案3】:

从选择合适的颜色图开始(看看here),Greens 可能会很好。请注意,可以通过在名称中添加 '_r' 来反转颜色图。

由于您的值差异很大,我将使用对数色标。 你可以通过包含color.LogNorm(来自import matplotlib.colors as colors)来做到这一点

为了解决您的第三个问题,我会将轴移动到右上角并删除底部和左侧线。

# Plot heatmap
f, ax = plt.subplots()
lognorm = colors.LogNorm(vmin = data.min(), vmax = data.max())
heatplot  = ax.imshow(data, vmin = 1, norm = lognorm, cmap = 'Greens')

# Move axis to top-right and remove bottom and left line
ax.xaxis.set_ticks_position('top')
ax.yaxis.set_ticks_position('right')
ax.spines['bottom'].set_visible(False)
ax.spines['left'].set_visible(False)

# Use instead of ax.set_title to move title a bit higher up
f.suptitle('Overlap') 

# Add colorbar
cb = f.colorbar(heatplot)

f.show()

【讨论】:

以上是关于Python热图:更改颜色图并使不对称的主要内容,如果未能解决你的问题,请参考以下文章

更改绘图热图中的颜色条标签 (R)

更改 seaborn 热图颜色条上的刻度大小

定期更改 SQL Server 中加密数据库的对称密钥和证书?

Python 幂律符合使用 ODR 的数据中的上限和不对称错误

Python学习————对称加密和非对称加密

如何根据预先确定的约束值自定义热图颜色?