通过图数据库优化PageRank算法,让营销更精准有效

Posted TigerGraph

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了通过图数据库优化PageRank算法,让营销更精准有效相关的知识,希望对你有一定的参考价值。

传统营销的硬广越来越难做,取而代之的是各种带货大V、网红、流量明星的良心推荐。在社交网络越来越发达的今天,人们更愿意接受自己喜欢的“爱豆”或口口相传的大V安利。


在引流顾客如此困难的现在,企业如果能迅速找到有影响力的实体,并迅速引流到产品或服务上,从而实现流量变现,这将是企业赢得更多市场份额的有效手段。


拒绝僵尸粉


然而,你看到的影响力是真的影响力吗?在现在“2500块就能刷出50万的抖音粉”“几千块的10万加阅读量”, 这些所谓的影响力实体对企业来说则毫无用处。


因此,我们不光要看数量,还需要看间接受影响的实体,有没有直接的关注关系。比如说你的朋友转发了某个的微博,然后你也受到了影响,这才是真正具有“影响”的影响力。


通过图数据库优化PageRank算法,让营销更精准有效发现新市场


同时,市场被细分成越来越多精致的小众市场,定制化的小众产品或服务让客户更愿意为其买单,巨头企业那套通吃的方法不再能通吃。因此,需要快速发现小众群体的热点,找到那个具有影响力的实体从而在新市场中占有一席之地。


那如何在电子营销中先人一步找到真正具有影响力的“带货王”? 这就需要了解一下大家都听过PageRank算法(也称佩奇算法)。


PageRank算法是由 Google创始人Sergey Brin 和 Lawrence Page于1998年提出的一种网页排名算法,其核心思想是通过研究网络的拓扑结构和计算页面的入度(即页面被链接的次数),进而确定该页面的排名顺序。页面的入度越大,那么它的重要性就越大,排名也越靠前。一个页面之所以有指另一个页面的链接,是因为它认为该页面比较权威,内容真实可信,在相关领域有一定知名度。


通过图数据库优化PageRank算法,让营销更精准有效图数据库加持下的PageRank算法


PageRank算法测量每个顶点对于每个其他顶点的影响力。该影响力是递归方式定义的:一个顶点的影响力是基于引用它的其他顶点的影响力。 


如果(1)引用某个顶点的其他顶点越多;(2)或引用该顶点的其他顶点具有更高的影响力,则该顶点的影响力更大。它和个人在社交网络中的社会影响力大小是类似的。


解释PageRank值的常用方法是借助随机网络冲浪模型(Random Network Surfer model)。某个顶点的PageRank分数与随机浏览者在任何给定时间正好访问该顶点的概率成正比。 


即PageRank分数越高,则该顶点越经常被访问。上述结论的前提是,假设浏览者根据以下方式随机地访问顶点:


  • 假设浏览者在网络中按照网络拓扑一个节点一个节点地访问并跳转节点,并重复许多轮次。

  • 浏览者可以从任意起点开始其浏览动作。 这个“任意起点”的特性是PageRank算法的魔力之一,这意味着PageRank分数成为了该图结构本身的基础属性。

  • 每个轮次中,浏览者在当前顶点上可能的出发路径中随机选择一条,并重复该随机选择动作许多轮次。

  • 但同时,浏览者并不总是遵循网络的顺序浏览。 存在一种可能(确切地说是一阻尼(1-damping)),浏览者将忽略网络节点顺序,而神奇地跳转到某个随机的顶点。


格式定义:


  1. PageRank(FLOAT maxChange, INT maxIter, FLOAT damping, BOOL display, INT maxOutput)

  2. PageRank_file(FLOAT maxChange, INT maxIter, FLOAT damping, BOOL display, STRING filepath)

  3. PageRank_attr(FLOAT maxChange, INT maxIter, FLOAT damping, BOOL display)


通过图数据库优化PageRank算法,让营销更精准有效


示例:


我们在test10图(使用Friend边)上运行PageRank算法,其中包含以下参数值:damping = 0.85,maxChange = 0.001,maxIter = 25。 从图中我们可以看到顶点Ivy(最下方)的PageRank得分最高(1.12)。 这是有道理的,因为有3个相邻顶点指向顶点Ivy,比其他的任何顶点都要多,Ivy则最有可能成为他们其中的“带货王”。 同时,顶点Eddie和顶点Justin的得分恰好为1,这是因为它们不向外射出任何边。 这是为了演示算法而特别设计出来的。 同样,顶点Alex的得分为0.15,即(1-damping),因为没有边指向Alex。


通过图数据库优化PageRank算法,让营销更精准有效

social10图上运行PageRank(0.001,25, 0.85,"json",10) ,并使用Friend边


具体TigerGraph图数据库是如何通过GSQL实现PageRank算法?而相比其他图数据,通过TigerGraph图数据库实现的PageRank算法又有哪些优势?PageRank算法还有哪些应用?



了解更多TigerGraph

点击图片阅读


相比关系型数据库,图数据库的优势

TigerGraph2.4首次将模式匹配与高效图计算结合

GSQL,新型的图查询语言

以上是关于通过图数据库优化PageRank算法,让营销更精准有效的主要内容,如果未能解决你的问题,请参考以下文章

「二分类算法」提供银行精准营销解决方案

基于Multiple treatment的营销评估算法

线上广告投放时,如何基于「时空聚类算法」精准挖掘潜在客群?

线上广告投放时,如何基于「时空聚类算法」精准挖掘潜在客群?

营销型站点的建设流程是什么?

让数据更精准,神器标配:热图