如何通过CHIP-seq分析鉴别基因启动子和增强子
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何通过CHIP-seq分析鉴别基因启动子和增强子相关的知识,希望对你有一定的参考价值。
参考技术A 一、表观遗传学的组蛋白修饰染色体一个核小体由两个H2A,两个H2B,两个H3,两个H4组成的组蛋白八聚体和147bp缠绕在外面的DNA组成。组蛋白有很多修饰形式,包括组蛋白末端的乙酰化、甲基化、磷酸化、泛素化、ADP核糖基化等等,这些修饰都会影响基因的转录活性。而组蛋白H3是修饰最多的组蛋白。
组蛋白甲基化和乙酰化主要发生在它们的N-末端尾部并且可以影响基因的转录。大量研究表明,组蛋白乙酰化主要与基因激活有关,而甲基化取决于其位置和状态,与抑制或激活有关。组蛋白乙酰化主要发生在H3、H4的N端比较保守的赖氨酸位置上,是由组蛋白乙酰转移酶和组蛋白去乙酰化酶协调进行。特定基因部位的组蛋白乙酰化和去乙酰化是以一种非随机的、位置特异的方式进行。乙酰化可能通过对组蛋白电荷以及相互作用蛋白的影响,来调节基因转录。
组蛋白甲基化的位点是赖氨酸和精氨酸。赖氨酸可以分别被一、二、三甲基化,精氨酸只能被一、二甲基化。研究表明,组蛋白精氨酸甲基化是一种相对动态的标记,精氨酸甲基化与基因激活相关。相反,赖氨酸甲基化似乎是基因表达调控中一种较为稳定的标记。例如,H3第4位(H3K4)的赖氨酸残基甲基化与基因激活相关,而第9位和第27位赖氨酸(H3K9,H3K27)单甲基化与基因激活有关,三甲基化与基因沉默相关。
基因组包含大量的非编码DNA调控元件,包括沉默子、绝缘子、启动子和增强子,在基因表达中起重要作用。 启动子 是RNA 聚合酶识别、结合和开始转录的一段DNA 序列,它含有RNA 聚合酶特异性结合和转录起始所需的保守序列,一般位于转录起始位点的上游。 增强子 是指能够使基因转录频率明显增加的 DNA序列,是关键的调控元件,可以影响基因转录,而与其方向或距离无关,增强子通常可以远离其调节目标数千个碱基对。增强子有别于启动子处有两点:[1]增强子对于启动子的位置不固定,而能有很大的变动;[2]它能在两个方向产生相互作用。一个增强子并不限于促进某一特殊启动子的转录,它能刺激在它附近的任一启动子。
组蛋白修饰能预测染色质的类型(异染色质或常染色质)、区分基因组功能元件(启动子、增强子、基因主体)以及检测决定这些元件处于活性状态或是抑制状态。例如H3K4me2和H3K4me3修饰大多数富集在转录起始位点附近的启动子上激活基因表达,而H3K27me2和H3K27me3与基因抑制相关。
因此可通过CHIP-seq分析组蛋白修饰的分布寻找基因的启动子区和增强子区域及其是激活或抑制基因表达。
H3K4me1可作为增强子的标志,H3K4me3作为启动子标志。研究表明,H3K4me1和H3K4me3与基因激活相关,H3K4me3主要富集在转录起始位点附近的启动子区域,而大多数H3K4me1修饰富集在增强子区域;H3K27ac与基因激活相关,主要富集在增强子和启动子区域,当增强子区只有H3K4me1修饰富集时,该增强子处于平衡状态,而当增强子区域同时富集H3K4me1和H3K27ac修饰时,该增强子就处于激活状态促进基因表达;H3K27的甲基化是可逆的过程,H3K27me1显示出对转录具有正向影响,启动子区域的H3K27me3甲基化修饰时抑制基因的转录,而H3K27me2广泛分布并且在沉默非细胞类型特异性增强子中起作用。
下表为常见的组蛋白修饰的主要分布及功能:
异染色质是染色质的浓缩,转录无活性状态,H3K9甲基化是异染色质的标志。H3K27me1和H3K9me3存在于着丝粒异染色质区域,而H3K27me3和H3K9me2共同存在于抑制的常染色质区域中。H3K9ac也与H3K14ac和H3K4me3高度共存共同作为活性基因启动子的标志。
Histone H3K27ac separatesactive from poised enhancers and predicts developmental state . Creyghton, M.P. et al. Proc. Natl. Acad. Sci. USA 107,21931–21936 (2010)
图注:A、使用ChIP-Seq鉴定的远端H3K4me1组蛋白标记鉴定了鼠ES细胞中的细胞类型特异性增强子:基于H3K4me1富集和非H3K4me3富集的的热图选出25,036个推定增强子。B、缺乏H3K27ac富集的增强子近端基因与平均增强子近端基因相比表现出较低的表达水平,表明H3K27ac是区分活性和平衡增强子状态的良好标志。C、选择富含H3K27ac的增强子使用先前发表的小RNA-Seq数据集检测这些短RNA表达与富含H3K27ac的增强子的关系,发现这些短RNA确实从H3K27ac阳性增强子转录。这再次支持H3K27ac是活性增强子元素的确定性因子。
图注:使富含H3K4me1的远端区域的邻近基因活性增强是H3K27ac的功能。A、显示显示组织特异性分布的四种指定细胞/组织类型中增强子峰周围的四千碱基对H3K27ac富集的染色质状态(下图);B、A中所示的H3K27富集区域的相关性分析,近端基因的活性与所有成体组织中的远端H3K27ac富集正相关;C、成年肝脏的微阵列数据的基因表达,显示所有基因(全部)和发现与肝脏增强子特异性相关的基因的增强子富集(+)或未富集( - )的H3K4me1或H3K27ac的基因表达。
图注:神经糖蛋白是在ES细胞中具有平衡的增强子,其在神经祖细胞中变得活跃的基因。基因跟踪H3K4me1(绿色,顶部),H3K27ac(红色,中部)和H3K4me3(黑色,底部)在Neuroglycan C基因的20,792 bp大区域的富集。这些数据表明当细胞切换发育状态并且H3K27ac可用于区分两种增强子状态时,增强子通过激活平衡增强子在细胞分化中发挥确定性作用。
如何通过数据分析鉴别假微博大V?
导读:某微博MCN机构旗下380万粉丝博主,带货能力基本为0,流量全靠刷。怎样鉴别这种假大V和不靠谱的MCN?让我们从头慢慢开始聊……
作者:宋天龙
来源:大数据DT(ID:hzdashuju)
MCN并不是一个新出现的模式,很早就出现的微博、公众号等都具有MCN特征。但当以短视频为主的新型媒体出现后,MCN才爆发出强大的社会影响力。当前,借助于MCN实现企业爆发式的销售增长,是非常火热的一种渠道形态。
01 什么是MCN
MCN(Muti-Channel Network)即多渠道网络服务,它通过持续的内容输出来实现特定商业目标。
在MCN机构出现之前,其实就已经出现KOL、KOC、PGC、达人、IP、大V等概念和实体,MCN的出现让这类资源实现了组织化、规模化和专业化,企业级的运作也更有效率,效果也更加显著。本节的MCN范畴包括集团、公司、工作室、个人等多种组织形式。
MCN起源于网红经济运作模式,在后端通过签约网红将具有一定话语权或关注度的“人”聚集起来;中间通过专业的运营团队持续稳定地输出内容;后端通过与企业的合作实现商业变现,例如广告、品牌合伙人、直播等。
02 MCN直播带货模式的“危”与“机”
MCN可以为企业提供整合营销传播方案,也可以通过内容分发触达目标客户。此外,MCN还可以通过直播带货的模式,直接为电商企业带来订单。
MCN的直播带货模式,让企业发现了融合“渠道”与“销售”的新机会——直播电商。
根据知瓜数据发布的2020年双11期间淘宝直播Top周榜,在2020年10月19日至2020年10月25日期间,预计薇娅带来的商品销量为1799.1万件,销售流水为67亿元。这直接反映了MCN在电商销售中强大的带货能力,直播带货已经成为电商以及零售企业的巨大机会。
“危”与“机”是并存的,在面对巨大机会的同时,企业也需要注意直播带货的潜在问题。
避免被MCN渠道绑架。出于分散经营风险以及对营销渠道的掌控权的考量,尽量将MCN渠道的用户分散到其他渠道甚至私域渠道,否则当用户形成行为习惯时就会导致企业从“一个坑”跳到“另一个坑”。例如线上销售(包括流量)渠道从天猫、京东、苏宁转移到MCN渠道。
注意高销售流水背后的高退款率和退货率。MCN带来的转化仅仅是销售线索的引导或者初步订单完成,企业后期可能会面临高退款率和退货率问题。尤其是在冲动消费决策、好奇购买等问题场景下,该问题非常严重。
选对合作模式。目前企业与MCN渠道的合作模式有两种:服务费(或坑位费)加佣金和纯佣金。后者是CPS(Cost Per Sale,按销售付费)模式,因此成本和收益相对可控;而如果是前者,则可能给企业带来较大的合作风险。国内已经出现企业花费巨资邀请某著名主持人在羽绒服、貂皮大衣直播带货时销售额几乎为0,国内某知名演员卖保温杯销量为个位数的案例。
全民免疫期的到来。任何一个新营销模式在刚出现时都会给用户带来新鲜感,当直播带货进入稳定期后,其带货能力可能出现“滑铁卢”。
MCN主播现场的不可控性。在直播现场,企业无法100%掌握主播传播的信息,其中可能出现由于主播本身的言论或行为不当导致对企业形象和商品造成负面影响的情况,甚至可能有触犯法律的风险。
03 企业与MCN的供应链合作
企业借助于MCN实现整合营销传播或电商销售,属于整个供应链环节的下游,即商品生产出来后,由MCN辅助传播与销售。实际上,企业与MCN完全可以进一步深化供应链合作关系。
MCN背后关联的是一群人(的需求)。通过MCN可以集中收集和反馈与企业的商品相关的信息和诉求,例如产品功能、特性、样式等,这些信息可用于生产型企业的商品策划、设计与开发,实现C2B(Customer to Business)或C2F(Customer to Factory)的反向推动。
这种合作模式有利于实现供需平衡,对于降低库存风险、提升供应链效率、拓展与覆盖市场具有重要意义。
当然,在消费者反向推动生产的合作模式中,企业生产遵循边际成本随规模递减的规律,因此需要合理预估MCN背后的人群的需求规模。
04 MCN渠道适用的营销场景
MCN背后聚集的资源基于人与人的连接关系,这些连接关系可以反映到任何社群渠道上,因此对于营销渠道本身没有限制。一定程度上,对于MCN渠道,人即渠道,这是它与其他渠道最大的区别。MCN渠道在营销应用时,主要的适用场景如下。
直播带货。这是目前MCN最适用的营销场景。
品牌传播。企业可以利用MCN在各个平台上的专业内容生产能力及粉丝影响力实现品牌曝光与传播的目的。
市场形象、口碑传播和维系。当企业面临较大的公共关系危机或需要树立品牌形象时,可以考虑利用MCN背后的IP、KOL、KOC、网红和达人等来进行观念传播和舆论引导。
提示:虽然MCN渠道有大量的粉丝,但这些粉丝在短期内很难直接转化为企业粉丝,因此企业需要降低粉丝转化预期。另外,MCN渠道在运营过程中,如果涉及第三方平台上的电商销售模式,例如淘宝电商等,将无法直接对企业的自有站点进行引流,而“仅仅”能起到带货、品牌曝光的作用。
05 数据如何应用到MCN渠道运营
这里仅介绍非广告场景的数据应用场景。MCN渠道本身的数据差异化应用场景包括如下几种。
1. 甄别MCN渠道资源的真实影响力
在企业与MCN合作之初,需要对MCN的真实实力(例如粉丝规模、影响力、历史带货能力)进行评估,以确定合作意向、合作模式、预期产出等。
图2-11为某微博账号的粉丝与内容互动情况。图中显示了其粉丝为38万左右,但其发布的内容的收藏、转发、评论和点赞数基本都是个位数。这些互动数据与庞大的粉丝量严重不匹配,说明粉丝中的异常情况比较严重,例如虚假粉丝、沉积粉丝、无效粉丝、机器粉丝等。
▲图2-11 某微博账号的粉丝与互动情况
2. MCN直播带货的选品、物料、销售卖点、库存销售预测的准备
企业在选择直播带货时,需要从数据层面综合考虑MCN资源与企业商品的契合度,包括销售周期、价格、商品等选品环节;同时,商品信息提炼、销售卖点、场景化、消费用户画像等方面也需要通过数据深入挖掘并提供给MCN主播使用;最后,根据MCN资源的历史带货能力与企业的选品,预估商品销量,为后端库存准备、物流和配送等提供参考。
如表2-2所示,李佳琦和薇娅都是MCN的头部力量,二者之间的差异性非常大。李佳琦侧重于淘宝直播+抖音平台,品类以美妆为主;薇娅侧重于淘宝平台,全品类进军。企业在选择MCN机构合作时可以综合参考二者的品类、平台、运营特点等,与企业自身营销目标结合。
▼表2-2 头部MCN差异性对比
3. 渠道运营效果评估与真实性核算
MCN渠道运营效果的评估涉及两个方面:一是根据运营情况做效果统计分析,二是根据实际结果数据核查数据的真实性。其中第二点主要核查数据中的“虚假订单”或“刷量问题”,通过数据分析设定合理的“正常订单”的状态(例如收货或收货后14天),排除订单中的异常记录,以最大程度规避企业风险。
例如,2019年某创业者与微博MCN机构合作,选择粉丝高达380万的某微博博主进行营销,微博发布后49分钟,有12.1万的观看量,另有几百到几千不等的评论、点赞、转发,但后台系统数据表明店铺流量和成交量基本为0。
如图2-12所示,图中①是在活动发布49分钟后产生的微博上与粉丝的互动数据,右侧的②和③显示了后台监测到的流量和支付金额的真实贡献。
▲图2-12 MCN真实影响力判别
从面2-12所示的结果可以发现,该微博博主的粉丝几乎都是假的,并且互动时的“用户参与”也基本是靠刷流量得到的,因此本次合作毫无疑问是失败的。
06 知识拓展:MCN渠道直播带货选品的考虑要素
MCN渠道直播带货并不适合任何企业或企业的任何商品。选品时需要综合考虑4个要素。
商品与MCN资源的适配度。潜客与商品目标受众适配才能保证商品有机会卖出去。
商品毛利区间。商品毛利情况决定了直播带货的销售模式是否亏本。以淘宝直播的淘宝联盟规则为例,规定佣金比例区间为20%~90%,就基本上将很多薄利的类目(例如大家电、3C产品)过滤掉了。目前主要的直播带货品类集中在美妆、衣服鞋帽、母婴、食品等高利润类目。
低决策成本与短决策周期。直播带货主要依赖于MCN资源现场的销售能力,因此适合于冲动性购买、尝试性购买的低决策成本与短决策周期的购物类目;而大客单价、决策周期较长的类目不适合直播带货,例如保险、珠宝、黄金等。
无专业知识或低专业知识商品。过多的专业知识会给直播带货带来极大的销售阻力。因为MCN主播们很难在短时间内理解或掌握商品的专业性知识,即使勉强解释出来,其受众也未必能够理解,更不用提交易转化。汽车、古董、收藏品就属于这一领域。
关于作者:宋天龙,资深大数据技术专家,有11年数据分析工作经验。触脉咨询合伙人,前Webtrekk(德国bigest在线数据分析服务提供商)中国区技术和咨询负责人。中国商业联合会数据分析专业委员会《中国大数据人才培养体系标准》专家组成员、虎嗅奖聘委会委员、DMT数字营销人才认证委员会认证委员。
本文摘编自《电商流量数据化运营》,经出版方授权发布。
《电商流量数据化运营》
点击上图了解及购买
转载请联系微信:DoctorData
推荐语:知名专家宋天龙新作,流量运营教科书,低成本、大批量、高质量流量引入,含大量案例、数据源和代码。
刷刷视频👇
干货直达👇
更多精彩👇
在公众号对话框输入以下关键词
查看更多优质内容!
读书 | 书单 | 干货 | 讲明白 | 神操作 | 手把手
大数据 | 云计算 | 数据库 | Python | 爬虫 | 可视化
AI | 人工智能 | 机器学习 | 深度学习 | NLP
5G | 中台 | 用户画像 | 数学 | 算法 | 数字孪生
据统计,99%的大咖都关注了这个公众号
👇
以上是关于如何通过CHIP-seq分析鉴别基因启动子和增强子的主要内容,如果未能解决你的问题,请参考以下文章