利用Python画Venn韦恩图分析数据差异及共同点

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用Python画Venn韦恩图分析数据差异及共同点相关的知识,希望对你有一定的参考价值。

参考技术A 有时候我们的数据之间需要比较异同点,这时我们可以利用Python画Venn韦恩图来分析

示例速览

例如我有两组数据(字符串列表),一组自己的数据,一组文献上的数据,需要分析共同的个数

结果:
可得到如下数据图表 两组数据之间有39个相同的

MATLAB | 全网唯一,使用MATLAB绘制好看的韦恩图(venn)

韦恩图绘制的代码MATHWORKS上也有,不过最多只支持四组绘制,于是我参考R语言ggVennDiagram包制作了一款支持7组样本的韦恩图绘制MATLAB函数。

注意:仅代码无法运行,需要导入.mat格式的素材包,素材包及m文件获取放在文末,

另:由于代码开发基于polyshape对象,本韦恩图绘制函数理论上需要至少R2017b及之后版本才能使用。

由于工具函数过长,将被放在最后展示,以下将先展示函数用法。

示例图


使用教程

1 数据格式

数值格式需要如下形式的数值向量,目前还不支持字符串元胞数组格式,请自行将其改编为数值向量,如下例子所示若数值400同时出现在X1及X2中,即说明该元素属于X1,X2的交集。

X1=randi([1,500],[100,1]);
X2=randi([1,500],[100,1]);
X3=randi([1,500],[100,1]);
X4=randi([1,500],[100,1]);
X5=randi([1,500],[100,1]);
X6=randi([1,500],[100,1]);
X7=randi([1,500],[100,1]);

2 基本使用

以下两种形式均可:

XX=X1,X2,X3,X4,X5,X6,X7;

VN=venn(XX1:7);
VN=VN.draw();
VN=venn(X1,X2,X3,X4,X5,X6,X7);
VN=VN.draw();

3 添加标签

draw函数绘图前使用labels函数添加标签:

VN=venn(X1,X2,X3,X4,X5,X6,X7);
VN=VN.labels('AAA','BBB','CCC','DDD','EEE','FFF','GGG');
VN=VN.draw();

4 样本数量

支持样本数量为2-7的任意值,例如绘制两样本则使用如下格式调用:

VN=venn(X1,X2);
VN=VN.draw();

以下展示2-7组样本绘制效果:

5 修改多边形格式

使用setPatch批量修改多边形格式,Patch对象具有的格式均可以修改。

使用setPatchN修改第N个多边形格式,Patch对象具有的格式均可以修改。

批量修改格式

全部改为灰黑色:

VN.setPatch('FaceColor',[0,0,0],'EdgeColor',[0,0,0])

修改第N个格式

单独将第1个对象改为灰黑色:

VN.setPatchN(1,'FaceColor',[0,0,0],'EdgeColor',[0,0,0])

循环修改格式

循环修改各个多边形颜色:

colorList=[78 101 155;
          138 140 191;
          184 168 207;
          231 188 198;
          253 207 158;
          239 164 132;
          182 118 108]./255;
for i=1:7
    VN.setPatchN(i,'FaceColor',colorList(i,:),'EdgeColor',colorList(i,:))
end

6 字体修改

使用:

  • setFont
  • setLabel

分别修改数字和标签的格式,举个例子:

VN.setFont('Color',[.9,0,0],'FontSize',14)
VN.setLabel('Color',[0,0,.9],'FontSize',25,'FontName','Cambria')


完整代码

注意:仅代码无法运行,需要导入.mat格式的素材包,素材包及m文件获取放在文末,

classdef venn
% @author : slandarer
% 公众号  : slandarer随笔

% 使用示例:
% =========================================================================
% X1=randi([1,500],[100,1]);
% X2=randi([1,500],[100,1]);
% X3=randi([1,500],[100,1]);
% X4=randi([1,500],[100,1]);
% X5=randi([1,500],[100,1]);
% X6=randi([1,500],[100,1]);
% X7=randi([1,500],[100,1]);
% XX=X1,X2,X3,X4,X5,X6,X7;
% 
% 
% VN=venn(XX1:7);
% VN.draw();

    properties
        ax % 绘图坐标区域
        % -----------------------------------------------------------------
        linePnts
        labelSet=' ',' ',' ',' ',' ',' ',' ';
%         labels='AAA','BBB','CCC','DDD','EEE','FFF','GGG';
        labelPos
        % -----------------------------------------------------------------
        classNum    % 多边形数量
        dataList    % 数据列表
        pshapeHdl   % polyshape对象
        fillHdl     % fill绘制的半透明多边形
        textHdl     % 绘制文本的句柄
        labelHdl    % 绘制标签的句柄
    end

    methods
        function obj = venn(varargin)
            if isa(varargin1,'matlab.graphics.axis.Axes')
                obj.ax=varargin1;varargin(1)=[];
            else
                obj.ax=gca;
            end
            hold on
            obj.classNum=length(varargin);
            obj.dataList=varargin;

            % 获取mat文件中的线条数据
            obj.linePnts=load('LD.mat');
            obj.linePnts=obj.linePnts.lineData;

            % 初始定义标签位置
            obj.labelPos2=[-.38,.3;.38,.3];
            obj.labelPos3=[-.38,.3;-.38,-.4;.38,-.4];
            obj.labelPos4=[-.38,.2;.38,.2;-.15,.3;.15,.3];
            obj.labelPos5=[cos(linspace(2*pi/5,2*pi,5)+2*pi/5-pi/7).*.47;
                             sin(linspace(2*pi/5,2*pi,5)+2*pi/5-pi/7).*.47]';
            obj.labelPos6=[cos(linspace(2*pi/6,2*pi,6)+2*pi/3-pi/6).*.49;
                             sin(linspace(2*pi/6,2*pi,6)+2*pi/3-pi/6).*.49]';
            obj.labelPos6=obj.labelPos6+[0,+.09;-.01,-.04;0,+.015;0,-.1;0,0;0,-.015];
            obj.labelPos7=[cos(linspace(2*pi/7,2*pi,7)+2*pi/5-pi/7).*.47;
                             sin(linspace(2*pi/7,2*pi,7)+2*pi/5-pi/7).*.47]';
            help venn
        end

        function obj=draw(obj)
            warning off
            % 坐标区域修饰
            obj.ax.XLim=[-.5,.5];
            obj.ax.YLim=[-.5,.5];
            obj.ax.XTick=[];
            obj.ax.YTick=[];
            obj.ax.XColor='none';
            obj.ax.YColor='none';
            obj.ax.PlotBoxAspectRatio=[1,1,1];
            % 循环绘制半透明多边形
            tcolorList=lines(7);
            for i=1:obj.classNum
                tPData=obj.linePnts(obj.classNum).pntsi;
                obj.pshapeHdli=polyshape(tPData(:,1),tPData(:,2));
                obj.fillHdl(i)=fill(tPData(:,1),tPData(:,2),tcolorList(i,:),...
                    'FaceAlpha',.2,'LineWidth',1.5,'EdgeColor',tcolorList(i,:));
            end
            % 构造初始bool集合
            baseData=[];
            for i=1:obj.classNum
                baseData=[baseData;obj.dataListi(:)];
            end
            baseShpae=polyshape([-.5,-.5,.5,.5],[.5,-.5,-.5,.5]);
            pBool=abs(dec2bin((1:(2^obj.classNum-1))'))-48;
            % 循环绘制标签
            for i=1:obj.classNum
                tPos=obj.labelPosobj.classNum;
                obj.labelHdl(i)=text(tPos(i,1),tPos(i,2),obj.labelSeti,...
                    'HorizontalAlignment','center','FontName','Arial','FontSize',16);
            end
            % 循环计算数字位置
            for i=1:size(pBool,1)
                tShpae=baseShpae;
                tData=baseData;
                for j=1:size(pBool,2)
                    switch pBool(i,j)
                        case 1
                            tShpae=intersect(tShpae,obj.pshapeHdlj);
                            tData=intersect(tData,obj.dataListj);
                        case 0
                            tShpae=subtract(tShpae,obj.pshapeHdlj);
                            tData=setdiff(tData,obj.dataListj);
                    end                 
                end
                [cx,cy]=centroid(tShpae);
                obj.textHdl(i)=text(cx,cy,num2str(length(tData)),...
                    'HorizontalAlignment','center','FontName','Arial');
            end  
        end
        % =================================================================
        % 设置标签文本内容
        function obj=labels(obj,varargin)
            tlabellength(varargin)=' ';            
            for i=1:length(varargin)
                tlabeli=varargini;
            end
            obj.labelSet=tlabel;
        end
        % 批量设置多边形格式
        function setPatch(obj,varargin)
            for i=1:obj.classNum
                set(obj.fillHdlR绘制韦恩图 | Venn图

基本维恩图在哪个位置

MATLAB | 全网唯一,使用MATLAB绘制好看的韦恩图(venn)

MATLAB | 全网唯一,使用MATLAB绘制好看的韦恩图(venn)

用R中pheatmap画heatmap

R 数据可视化 —— 韦恩图