ML学习分享系列_计算广告小窥[上]

Posted 寒小阳

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ML学习分享系列_计算广告小窥[上]相关的知识,希望对你有一定的参考价值。

原作:面包包包包包包
修改:寒小阳 && 龙心尘
时间:2016年1月
出处:http://blog.csdn.net/breada/article/details/50572914
http://blog.csdn.net/han_xiaoyang/article/details/50580423
声明:版权所有,转载请联系作者并注明出处

1. 引言

提笔写这篇博客,我的内心是惶恐的。原因很简单,作为一个资历尚浅的研究生,是没有资格对计算广告这样一个伟大的行业、领域和学科来评头论足的。之所以这么做,一是总结自己已掌握的知识,二是降低同学们的学习成本。本人能力有限,更缺乏实践经验,文章内容多为书籍和论文的读后感,若有不当或者错误之处,还望各位同学指出,我定悉心求教。在此,向编写《计算广告》的刘鹏和王超两位老师致谢,向各位paper作者致谢。

[关于ML学分计划]

  • 寒小阳龙心尘发起,一个互帮互助的机器学习知识共享平台。
  • 我们是一群对机器学习感兴趣的小伙伴,对于神奇的机器学习经常有“一探究竟”的冲动,却因为孤身一人学习的寂寞、亦或繁忙考试工作之余的小小拖延症,而没有持续这份对知识的渴求和热情。
  • 由于深感类似情况的小伙伴之多,我们希望建立一个“ML学分计划”——机器学习的学习和分享计划——来帮助我们一起更高效地学习、更集中地整理分享我们的知识和经验。因为我们也深信”证明自己真的透彻理解一个知识,最好的方法,是给一个不熟悉这个内容的人,讲清楚这个内容“。

[关于原作@面包包包包包包]

  • 海淀区明光村计算机职业技术学院,研二学生。
  • 关注计算广告点击率预估和竞价算法,关注机器学习和深度学习,初学者。

(上)(下)全文目录

  1. 引言

  2. 广告=>互联网广告:“您好,了解一下”

  3. 互联网广告=>计算广告:指哪儿打哪儿!

  4. 计算广告主要的四种形式:谁在弄潮?

  5. 计算广告关键技术:这孙子怎么什么都知道?

  6. 广告系统架构:要啥自行车,这里有宝马。

  7. 手把手系列之教你搭建一个最小广告系统:mieSys


2. 广告 => 互联网广告

“同学您好,了解一下!”宿舍楼下站着一位小姑娘,怀里捧着一沓宣传单,正在熟练的向每位路过的同学发放着。我伸手接过一张,冲她点了一下头以示友好。我一看是“撑了么”,不禁感叹O2O的钱是真多啊!按照已往经验,这波过后下一波不是“品碑”就是“美因”了。不对,不会是美因,好久不见什么动静了,应该就是品碑没错。没走两步,顺手把传单塞进了垃圾桶,脑海中还在推演着餐饮O2O的格局和未来。作为一个互联网人,每天这么关心行业发展,说实话还真的有点累呢。

广告对于我们每一个人来说都不陌生,甚至早已成为我们生活中非常重要的组成部分。无论我们再怎么厌恶它,屏蔽它,都不妨碍它在不同时间和不同地点,以不同的形式频频与我们相遇。世界上脸皮最厚的东西是什么,不是城墙角,而是广告。但是,你真的那么恨广告吗?恐怕也不是。想想你买过的吃穿用,是不是都是你熟悉的品牌呢,你是否还记得你与这些品牌的初次相遇呢?接下来,我就要开始认真的扯犊子了。

2.1.广告三要素

一句话解释广告:这个牌子我好像在哪里见过呢。

广告,是一项商业活动。说白了,就是广告主出钱让你看广告。哎呦喂,居然有人这么惦记着我,想想还有点小激动。想要完成一次广告展示,以下三要素必不可少:

  • 广告主:出钱让你看广告的那个人
  • 用户:你
  • 媒介:传单、广播、杂志、公共展位、报纸、电视和互联网等传播途径。

这三者之间的关系是博弈的,听起来好高端的样子。研究博弈的主要原因还是为了你好我好大家好,具体如下:

  • 广告主 vs 用户

广告主有做广告的需求,为的就是进行品牌宣传,在用户的脑海中静悄悄地种下一颗种子,在用户挑选同类商品时大声喊出“选我选我选我”。用户有了解品牌的需求,这样在挑选商品时才能选择出最适合自己的那一款。

  • 广告主 vs 媒介

广告主为了让广告能够传播的更广泛,就有选择合适媒介的需求,是印传单,还是投电视,哪个投入回报比最高就选哪个?媒介有发布广告的需求,因为这样可以通过出租广告位来获得收入,养活一家老小,还有那群可爱的程序员

  • 用户 vs 媒介

我们用户为了实现人生价值,都有收集信息,了解外部世界的需求。途径无非就是读书看报、电视上网,这是刚需,无关情怀。媒介有吸引用户的需求,因为用户来了,用户的注意力就来了,广告主也就跟着来了。

2.2 广告 => 互联网广告

一句话解释互联网广告:在互联网上做的广告,效果可衡量,广告主再也不用担心钱花的不明不白啦!

上面我们简单介绍了一下广告的背景知识,说白了就是三方各有需求,也各取所需,一个愿打一个愿挨,你好我好大家好。下面我们要开始介绍互联网广告了。

什么叫互联网广告呢?就是在互联网上做的广告。嗯…就是这么简单。再多说一些,其实是广告的媒介发生了变化。以前广告主要都在电视上做,是因为在那个年代用户的消遣方式比较单一,把时间都花在了看电视上。但是现在看电视的人少了,上网的人多了,广告主说:“我的小祖宗诶,你就看一眼吧”,于是广告就追着用户,做到了互联网上。

“自从广告上了互联网,广告的面貌就焕然一新。”造成行业巨变的原因,是因为互联网广告的效果可以被衡量。

回到本文最开始的“撑了么”传单。广告主只知道一共印了多少张传单,都交给谁去发,在哪个地方发,但是不可能知道是谁接到了这张传单,接到的人有没有看,看的人有没有买。这对广告主来说,我把钱花了,却不知道谁买了,有点不明不白,求广告主心理阴影面积。但是这钱不花还不行,这是传统广告面临的最大问题,即广告效果无法衡量

那互联网广告是如何解决这个问题的呢?很简单,通过网站的日志系统。通过对用户上网HTTP请求的解析,网站可以得到当前时间、访问用户的IP地址、用户的操作系统和浏览器版本等基本信息,如下图。

网站访问日志

这里,三列分别是这些用户在本站的cookie值(用来唯一识别本站的用户)、IP和访问时间。

更多的,通过脚本或者其他方式,网站可以对用户在本站的浏览行为进行记录,比如监控用户的点击行为、鼠标停留区域和停留时间等。如果用户点击的内容是广告,那么这个点击信息就会被后台数据库,如下图。

网站点击日志

这里,两列分别是用户点击过的广告id。

日志信息的记录,可以使得媒体网站和广告主能够清楚的看到到底是谁点击了广告。有了点击数据,广告主就可以知道自己投放的广告被多少人看到过,通过对投入回报比的评价来评估此次广告推广的效果,并为以后的推广活动提供参考。当然,这一切的根源,是建立在没有作弊数据这样的假设上的。

广告从线下走到线上,也算是半个O2O了。有了互联网技术的支持,广告效果不可衡量的魔咒终被打破。这似乎在预示着什么,广告人一直所追求的定向投放,进而实现精准营销的梦想,也许将在互联网的大潮中成为可能。预知后事如何,且看下一节:互联网广告与计算广告:指哪儿打哪儿!

3. 互联网广告=>计算广告:指哪儿打哪儿!

前面说到,互联网广告相较于传统广告,一个很大的优势就是广告效果可以衡量。这样的变化对于广告主来说,这钱花的终于有名堂了,爽!媒体网站看着一旁欣喜若狂的广告主,蛋蛋地说,“哦”。翻了翻这个月网站的收入,还行,租子都交齐了。又看了看下个月广告位的承租情况,也还行,都租完了。“咳”,叹了口气,喃喃说道,“最多也就这个数了?” 他打开后台数据库,随便看着网站的点击日志。突然,他身子一顿,僵在了那里;紧接着嗖的一下,眼睛凑到了显示屏前;随后,键盘声响起,一通噼里啪啦的敲打,一听就知道是青轴。当他按下最后的回车,一个饼图出现在屏幕的正中央。此刻,天亮了。

网站访问性别

3.1. 流量的神坛

一句话解释流量神坛:流量就是用户,用户就是上帝,因此流量就是上帝。

这张饼图所表述的意义是该网站当月访问用户的性别,男女各一半。你可能会问,这忙乎一晚上就出来这一张图。但是可别小瞧它,这张饼图一点都不简单,我来细细道给你听。

在传统广告的场景下,广告主做广告的方式是比较粗犷的。杂志广告,我买几期的封面,越大越好;报纸广告,我买几期的版面,最好是彩色的;电视广告,我买几次的播放时长,就要黄金时间段,最好是春晚前读秒的那种;展示牌广告,我买一个月的展示位,盘古大观上的LED就行。到了互联网广告的场景下,也这么买啊。网站上的广告位,不也类似于展示牌吗,我按月或者按季度包下来买不就完了吗?没错,在这张饼图出现之前,的确是这么做的。现在,也有很多广告和媒体是这么做的。但讲真,有了这张饼图之后,广告这个传统行业在互联网上即将开出绚丽的花。

接着前面的说,媒体网站看到这张统计出的饼图之后,陷入了沉思。既然来访的用户中男女各占一半,那我为什么还要在主页上对男性用户们展示那条女性护肤品的广告呢?那些水啊乳啊霜啊什么的这些大老爷们们又不懂,就算给他们脑海里埋一颗种子,不到他们买女性护肤品的时候它也不会叫啊!但是已经和护肤品公司签约了怎么办,我可是按月签的,违约多不好啊。转念又一想,广告主在意的是目标人群,作为一个女性护肤品品牌,对男性用户基本是没有期望的。既然这样,我们不再按照时间来承包广告位,而是按照人群划分来承包。我保证所有女性用户都能看到该护肤品的广告,不就行了嘛?同理,对于那部分男性用户,我可以放置剃须刀的广告,反正女性用户又不懂全面贴合和全身水洗到底有什么用。

如此说来,我网站上一个广告位不就可以实现时分复用,在相同的时间上投放两条广告了吗?可以多收一份钱,想想还有点小激动呢!可是,广告主们会愿意这样吗?我给他打个7折他肯定愿意啊,想展示的用户都展示到了,广告成本还降低了,这不是两全其美的事情吗?于是乎,互联网广告的结算形式从买展示时间,变成了买展示用户,行话叫做:买流量。流量作为用户注意力的表征,在广告主和媒体网站手拉手的簇拥下,登上了互联网的神坛。

3.2 计算广告

一句话解释计算广告:黑科技,可以将对的广告展示给对的人。

计算和广告这两个根本不相关的事情,是怎么在一起组成了一个领域和学科呢?一切还要从这个饼图来说起。

前面说道,媒体网站噼里啪啦敲了一晚的键盘,最终画出来了这个的饼图。可是,你媒体怎么就知道这一半是男性,那一半是女性呢?这种人口属性的信息,HTTP请求里可没有啊。

没错,的确没有,可是挡不住媒体网站有数据,会计算啊!

通过对点击日志的分析,媒体网站发现点击过女性护肤品的用户又点击过网站上其他女性品牌。在“女性用户对女性品牌可能更感兴趣”的合理假设下,判断这些用户的性别为女,男性用户同理。这里要说明一下,这里提到的男性女性,不是指用户真实的生理属性,而是用户在该媒体网站上所呈现的性别倾向。通过对日志数据的统计和计算,媒体网站可以对用户的性别进行判断,便是计算与广告的第一次亲密接触。下面给出计算广告的定义,来自斯坦福大学课程《Introduction to Computational Advertising》

Computional Advertising:Find the “best match” between a given user in a given context and a suitable advertisement.

计算广告定义

对于这个严肃的定义,我就不在此妄加翻译了。但为了方便各位同学理解,我便不恰当的将它总结为六个字:指哪儿打哪儿。就像前面说到的媒体媒体一样,给女性用户展示护肤品,给男性用户展示剃须刀,将对的广告展示给对的人,便是计算广告这样一门领域和学科所期望实现的了。

4. 计算广告四君子:谁在弄潮?

计算广告从本质上来说,只是广告在互联网环境下的一种存在形式,其商业属性从未发生过任何改变。计算广告之所以重要,是因为互联网技术和用户数据使得广告的效果可以被衡量,进而可以指导广告活动的各个环节的优化,这令资本十分感兴趣。既然计算广告还是广告,那么在广告主、媒体和用户之间,自然也存在着利益的博弈。在这一章中,我们将围绕着三方博弈来介绍计算广告的四种商业模式,在感受资本力量的同时初步理解计算在当中所扮演的角色。

4.1 合约广告

4.1.1 广告位合约展示量合约

一句话解释两种合约:前者漫灌,后者滴灌

互联网广告向计算广告的进化的标志,就是第二章中的那个饼图。在饼图出现之前,广告主与媒体网站之间的合约是广告位合约,即按时间承包广告位,按承包时间结算(CPT, Cost Per Time)。广告位合约下,广告主的投入是广告位租金,收益是合约期间的展示机会;媒体网站的投入是建站和维护的成本,收益是固定的广告位租金。这样对比下来,媒体网站的收入有天花板,因此网站有提高收益的动力。

在利益最大化的驱动下,媒体网站发现可以通过受众定向技术,即挖掘日志数据为流量打上标签,根据来访用户的性别标签实现广告位的时分复用。相较于改变之前,广告主投入降低,收益不变;媒体网站投入计算研发成本,收入提高。为了保证双方收益,还是来签个保证展示量的合约吧,约定好展示千次的价格(CPM:Cost Per Million),乘以总的展示次数即可。若不能完成合约的展示量,那么就算媒体网站违约。

在保证CPM的合约广告中,广告主和媒体网站都赚的盆满钵满。作为变革的引领者,媒体网站自然是闲不住的。他意识到广告位复用的关键在于流量这张饼所能切得的份数,份数越多,复用的次数就越多。广告主其实也挺开心,你就切呗,切的块越小我省的就越多。于是媒体网站真的开始乐此不疲的切饼了,从日志数据中挖掘出了年龄、收入、兴趣和地理位置等更信息。光切饼还不够,还要在切下的块之间互相组合拼凑:这一块是男性18~25岁北京的大学生,可以卖给棒子公司,正好最近刚出了一款千元机;那一块是女性无小孩年收入15~20万,白领妥妥的,卖给维少利亚的秘密吧。

网站流量细分

在受众定向技术的支持下,广告的商业模式从CPT变为CPM,保证展示量效果的合约形成,广告正式进入可计算的时代

4.1.2 在线分配

一句话解释在线分配:你该看啥,我唆了蒜

在收益最大化的驱使下,受众定向的技艺和方法已然登峰造极。媒体网站期望通过精细化标签实现广告位无限时分复用的场景,真的存在吗?一张饼我们可以咬着吃,一块饼我们可以泡着吃,但把饼切成了碎渣,团也团不起来的时候,就只好扔掉了。

我们来思考一个问题,媒体网站如何让用户看到他应该看到的广告?如果媒体网站能够提前知道某用户第二天是否会访问本网站,就可以根据该用户的标签提前准备好要展示的广告,做到“指哪儿打哪儿”。然而,理想很丰满,现实很骨感。单个用户是否会上网是一个随机事件,是不可预测的。因此在实际广告投放中,媒体网站需要在用户访问网站的那一瞬间,在线的、动态的为用户分配广告进行展示。在收益最大化的驱动下,媒体网站必须保证所有合约的展示量,因此在线分配是一个在“保证所有合约展示量”的限制条件下,媒体网站收益最大化的优化问题。为了合理的解决在线分配问题,媒体网站需要对每类用户的流量到访进行预测。只有当用户数量到达一定规模之后,整个群体的到访率才会满足一个概率分布,流量预测才会有迹可循,进而指导广告投放。如果标签太细,流量就会太小,不足以挖掘出正确的到访概率分布,直接影响在线分配结果。这必将导致展示量合约不能很好完成,损害了广告主利益,共赢的局面出现危机,媒体网站的日子当然不好过了。

4.1.3 非保量合约

一句话解释非保量合约:打不过就跑

受众定向技术对广告效果的优化所起到推进的作用是不言而喻的。理论上来讲,标签打的越精细,对用户人群的识别更精准,定向广告的效果也就越好。但是在保证展示量合约的模式下,在线分配问题的存在限制了媒体网站进一步提高收入的可能,陷入两难境地。如何让游戏继续下去,是媒体网站眼下必须考虑的事情。

“对广告主来说,他需要的只是用户注意力,并不care到底是按时间还是按流量。对于我媒体网站,既然CPM有在线分配的坑,那还是不要往里跳的好。只要能降低广告主成本并且保证广告效果,是可以再换一种玩法的”。想到这儿,媒体网站忍不住笑出了声,“呵呵哒~”

媒体网站究竟会采取什么新玩法呢?且看计算广告第二种商业模式:竞价广告。

4.2 竞价广告

老玩法CPM玩不下去的原因是什么?由于标签太细流量太小,再加上合约太多,媒体顾此失彼,不能合理的为用户安排好合适的广告。既然是在广告的分配环节出现问题,那干脆不分了,指定一家总可以吧,这一小撮人来了就看这个广告,OK问题解决了。。就这么简单?嗯,就这么简单。那只剩下两个问题了:指定哪一家,和如何收费。

  • 指定哪一家

一句话解释哪一家:谁出价高就是谁的

媒体网站手握优质精准流量,把这个流量卖给谁呢?仍然在收益最大化的驱使下,媒体网站选择公开拍卖的方式,价高者得。说起拍卖,大家应该都听说过,就是大家一起去争一个东西,出价最高者得。写到这里,我特别想插播一条新闻(图文来自网络)。

《史上最贵!好声音巅峰之夜1分钟广告3千万!》

优信二手车

宣布冠军前60秒硬告以500万底价起拍。在大战93回合后,最终由广告主优信二手车以3000万人民币的价格成交,只播一次,再刷中国电视史上单条广告之最。

上上上上上。。。好了,言归正传。媒体网站也西装革履,拿着小锤开拍卖会:我有这么好的流量你们谁要呀?
广告主A:我要,我腿长!
广告主B:我要,我脸美!
广告主C:我要,我胸大!
广告主D:我要,我有钱!

“Duang~~~”,恭喜广告主D获得本轮竞拍的胜利,让我们用掌声向他表示祝贺,礼仪小姐请把鲜花和POS机送给他。

  • 如何收费

不管玩法怎么变,广告主希望获得较高的投入回报比的想法不会变。在拍卖中,由于流量比较精准不用担心回报,所以如何降低成本是广告主唯一关心的事情,因此广告主有出低价的动力。如果采用前面好声音那样公开叫价的方式,广告主之间互相知道出价,广告主就有少加价的动力。鉴于这两点原因,拍卖方式的选择和收费方式的选择共同决定了媒体网站的最终收益。

密封拍卖

一句话解释密封拍卖:你猜猜我出了多少钱

既然公开叫价拍卖会诱发广告主少加价的动力,那媒体网站就采用密闭拍卖的方式。在密闭拍卖中,广告主不再公然喊出出价,而是将出价放进密闭信封里交给媒体网站,广告主互相之间不知道对方的出价。这样一来,广告主所出价格就是自己对流量价值的估计,从而避免了少加价现象的发生。

广义第二高价

一句话解释广义第二高价:有钱都不让花

为了避免广告主出低价,媒体网站采用广义第二高价(GSP: Generalized Second Price)的方式收费。比如广告主A出10元竞拍,广告主B出5元竞拍,广告主C出3元竞拍,那么广告主A只需要付5元就可以获得一段时间内对该标签流量的广告展示机会。广义第二高价的采用,显著提高了广告主下探底线的成本,因为广告主也明白,与其追求最低价赢得一次竞拍,不如适当价格赢得多次展示机会对品牌销量的提高更划算。

按点击收费

一句话解释按点击收费:“上好的西瓜嘞,不沙不甜不要钱”

按点击付费(CPC:Cost Per Click)是指广告被用户点击一次,广告主应给媒体付的价格。媒体网站的收入是点击价格和点击总数的成积。

经历了出价方式和收费方式的折磨,广告主快坐不住了。我们给你出钱,你到底给我们放广告了吗?为了监督你们,我们要按用户的点击付费,点一次给一次的钱!媒体网站一想,也合理,那就按点击付费吧,反正我的流量标签打的好。

在密封拍卖、广义第二高价和按点击付费的组合模式下,广告主的出价时考虑更多的是流量本身所能带来的价值,而非过度追求成本的节约。媒体网站的总体收益也打破了天花板,取得了令人满意的结果。

如果说传统广告向合约广告的转变标志着广告正式进入计算广告时代,那么合约广告向的竞价广告的转变就代表计算广告进入了快速发展的黄金时代,竞价广告迅速成为了互联网流量变现的主要模式。同时我们也应该注意到,媒体网站依靠所掌握的数据和技术,引领了合约广告和竞价广告两次浪潮,在广告活动中的话语权越来越重。作为金主的广告主,虽说广告收益很不错,但只能喝汤吃不到肉,心里总是不太爽的。“数据和技术,我能不能也做一些呢?”,广告主喃喃的说。

广告主会逆袭吗?且看计算广告第三种商业模式:程序化交易。

4.3 程序化交易

互联网广告发展到了竞价阶段,计算格局已基本建立。媒体网站负责利用受众定向等技术深度挖掘日志数据,为流量打标签;广告主通过竞价方式获得感兴趣标签流量的展示权利,并通过CPC与媒体网站进行结算。双方各取所需,相处融洽。然而,随着广告主优化效果的要求进一步加强,广告主希望能够做一些个性化的广告推广,例如对回头客做一次打折回馈,或者对老用户做一次新品推销。然而像“回头客”,“老用户”这样的标签,媒体是加工不出来的,所以无法满足广告主的这种需求,这让广告主十分不满。为什么加工不出来呢?

媒体网站所拥有的数据是哪个用户点了哪个广告,如下图中,用户在某度上搜索“单反相机”,并点击了某东的广告,这些数据某度是知道的。

媒体网站数据

但是用户点击广告之后,网页就跳转到广告主页面上了,究竟用户有没有下单,这个数据只有某东自己知道,某度是不知道的,因为此时用户不在某度的页面上。

广告主数据

那可如何是好呢,广告不能不做,钱不能不赚。于是乎媒体网站和广告主俩人坐一起开始合计。

媒 体:哥,要不您把那用户购买数据给我,我就能给您找出这部分用户,打上标签。
广告主:老弟呀,那可不成,那岂不侵犯用户隐私了?人家买什么怎么能让你们知道呢?
广告主:嘿嘿,要不,你把用户访问和点击数据给我得了,我不就能做了嘛!
媒 体:哥您憋难为我,那我不也侵犯隐私了!人家搜了什么看了什么点了什么,也不能让你们知道啊!
广告主:你得了吧,用户现在上网,哪儿还有什么隐私啊,不然你们那标签能打的那么准?
媒 体:嘘……小点儿声……别让他听见……

(两人捂嘴偷笑5秒)

广告主:这么着吧,咱找个公平的中间第三方,一头接你,一头接我。你把我感兴趣的用户都给这小三,小三再给我。我看这用户要是在我这儿买过东西,那我就要这个流量,没买就不要。这小三只起一个中间人的作用,不存数据,您看行吧?
媒 体:哟,行啊哥!您什么时候也会用互联网思维思考问题了?靠谱,就这么着吧!来来我敬您一杯。

(两人碰杯一饮而尽)

广告主:老弟呀,你看我这也一把年纪了,那个什么计算啊数据啊,我是整不动了,准备找人帮我弄,我就只管大(给)局(钱)了。咱俩也出生入死这么久了,从CPT到CPM再到现在的CPC,也该歇歇了,多陪陪老婆孩子。
媒 体:哥,您说的对,来我再敬您一杯。
广告主:等我说完。哥哥再给你建个意,要我说呀,你也甭干了,花点钱顾几个人儿替你守着,不就结了嘛。
媒 体:对啊,哥,我咋没想到呢,我媳妇儿整天埋怨我下班晚。您真是我亲哥,来我再敬您。。

(被广告主打断)

广告主:不不不,这杯我敬你。干了这杯酒,这事儿啊,就这么定了!咱哥俩啊,享受生活去
媒 体:对!享受生活,干!
(两人碰杯一饮而尽,席间觥筹交错,直到天明)

这段对话信息量还是挺大的,我们来分析一下主题思想,并做一些补充扩展。

  • 供应方平台

一句话解释SSP:“哥,你要找的就是这个人!在主页给他点颜色看看不?”

因为媒体网站在广告活动中负责提供广告位,所以又被称为“供应方”,这里的供应方平台(SSP:Supply Side Platform)是媒体网站顾的小弟,代表媒体网站利益的代理机构,主要负责管理媒体网站的广告位,负责与广告交易平台进行流量对接。

  • 需求方平台

一句话解释DSP:“这人买过我东西,我出10块!”

因为广告主在广告活动中有做广告的需求,所以又被称为“需求方”,这里的需求方平台(DSP:Demand Side Platform)是广告主顾的小弟,代表广告主利益的代理机构,主要负责替广告主采买流量以及研发相关技术。

  • 广告交易平台

一句话解释ADX:“SSP和DSP,两手都要抓,两手都要硬”

广告交易平台(ADX:Ad Exchange)是一个独立第三方平台广告交易平台,就是那个“小三”,两侧分别接入多个SSP和多个DSP。主要有传递信息和管理竞价两个作用,类似股票交易市场。

SSP, ADX, DSP三者形态如图所示(图片来自网络)

SSP,ADX,DSP

  • 实时竞价

一句话解释程序化交易:广告主为实现个性化营销所举办的海天盛筵。

实时竞价(RTB:Real-Time Bidding)是一种新的广告销售模式,我们先来看一次RTB的过程:

RTB

Step1,某用户打开浏览器,登录了某媒体网站。该媒体网站通过标签分析,发现用户的标签是“标识XXX,男性,20-25岁,跑鞋爱好者”。

Step2,媒体网站将该用户上网了以及标签信息通过SSP传给ADX,说“看看谁要这个人在首页的广告展示机会”。

Step3,ADX将用户标签信息和广告位信息广播给所有对接的DSP,问“你们谁要这次展示机会呀”.

Step4,DSP1(代表某克)和DSP2(代表阿迪某斯)同时接到了“标识XXX,男性,20-25岁,跑鞋爱好者,广告位为首页”。DSP1通过标识在购买数据库里查,发现这个人买过我司的商品,符合我司为老用户推广新品的目标,于是两眼放光。DSP2也通过标识去查,发现这个人没有买过我司商品,并不属于老用户。通过查询购买历史数据,两个DSP心里差不多有谱了。

Step5,开始竞价。DSP1觉得这个人是老用户,很满足我司需求,出10块买这次首页的展示机会。DSP2觉得这人仅仅是个潜在客户,出5块争取一下吧。于是一个出10块,一个出5块,出价信息返回到ADX。

Step6,ADX通过对比价格,发现10块是最高的,判定DSP1赢得此次竞价,对DSP1说:“恭喜您本次竞价成功,请返回您的广告和5块钱”,没错,这里收费依然是GSP。

Step7,DSP1高兴坏了,赶快把最新款跑鞋的广告和5块钱给ADX

Step8,ADX接到跑鞋广告和5块钱,将之返回给SSP。

Step,SSP接到广告和5块钱,交给了媒体网站。

Step10,广告顺利展示,用户在页面打开之前看到了广告,整个过程在100ms之内全部完成。

一次RTB完成后,媒体网站给SSP发红包,广告主给DSP发红包,DSP和SSP都给ADX发红包。说起红包,大家对这个图应该都不陌生。

谢谢老板

通过上面例子我们可以看出,实时竞价所购买的是此刻的广告展示机会,出价高低主要看这次展示与广告主个性化的标签的匹配程度。比如上例中,此刻的展示机会就是这个人即将在首页的广告位,个性化标签是“老用户”,越老,越要出高价争取。下表我们列举了实时竞价与第二种广告模式:竞价广告的对比。

广告模式竞价方式标签来源竞品一句话解释
竞价广告暗拍,GSP媒体网站,受众定向标签媒体网站上一段时间内,该标签所有用户的广告展示机会提前把菜做好,只等客人来端上桌
实时竞价暗拍,GSP广告主,个性化标签媒体网站上当前时刻,该标签当前用户的广告展示机会不提前做,客人来想吃什么现点现做

通过对比,我们可以很准确的抓住实时竞价的两个特点:实时和个性化。那什么叫程序化购买呢,讲了半天也没提这种广告模式。程序化购买,就是指实时竞价的整个过程都是由程序自动完成的

程序化交易是当前计算广告所处的时代,下图是RTBChina于2015年7月份统计的中国程序化交易市场上的主要产品,十分热闹,值得一看。除了DSP、SSP和ADX,还有很多非常重要的力量,如数据管理平台(DMP:Data Management Platform)和第三方检测机构等,都为程序化交易提供服务和支持,保障着这一模式的健康发展。

中国程序化交易市场

我们终于讲完了历史和现在,坚持下来的同学给自己鼓个掌吧![啪啪啪啪啪啪]。回顾历史,在合约广告和竞价广告中,媒体网站占优势地位,而在程序化交易广告中,广告主占优势地位。一直都是广告主和媒体网站围绕着流量在博弈,我们用户的声音呢?未来会是我们的吗?且看计算广告第四种模式:原生广告。

4.4 原生广告

一句话解释原生广告:你看的是广告你知道不?你以为你以为的就是你以为的?

广告发展到现在,广告主和媒体网站关注更多的是如何更加充分的实现流量变现,而忽略了广告与媒体内容的结合,这非常容易造成用户的反感,使用户觉得自己隐私被泄漏。而原生广告所追求的是广告与媒体内容的统一,通常被称为“内容即广告”,所追求的效果是用户在浏览内容时,不自主的就把广告给看了,主要形式有信息流广告、搜索广告和软文广告等,这里以一个软文广告举例。

  • 一篇软文

不知有没有看《权力的游戏-冰与火之歌》的同学,如果有,那么这篇《琼恩·雪诺没死——史塔克家族的逆袭开始了》一定合你胃口。没看过的也没关系,我大致解释一下。在这部剧中,给大家留下了一个很大的疑问,那就是“男主角到底死了没”。这篇文章完整了梳理了一遍故事主线,并且从各个细节来证明“男主角没有死”。最重要的是,在合理推出男主角没有死之后,紧接着来了这么一段话:

搜狗知乎

看到这个,我第一反应,“我靠!原来是软文,也是哔了狗了!”,但紧接着我也就释然了,永远的记住了搜狗和知乎勾搭在一起为我提供的这篇高水准的文章,我怕是再也忘不掉这两款互联网产品了,也更期待新一季的《冰与火之歌》了。有时我会不经意的想,到底谁是广告主,是冰火?还是搜狗+知乎?如果是后者,那《冰与火之歌》给他们钱了吗?

  • 移动互联时代

原生广告为什么会成为计算广告的未来?因为移动互联来了,用户的消耗在移动端的时间开始变多,这意味了什么?思考三秒钟。


1

2

3


没错!这意味着用户注意力的转移,意味一大波广告主要追到移动端了!你可能会说,那也没什么变化,我上的还是那个互联网呀,只不过从电脑换成了手机。没错,就是因为你用的屏幕变小了,原来电脑上不觉得大的广告很容易覆盖整个手机屏幕,还显示不完。。。求此时用户心里阴影面积。因此,如何在保证用户正常阅读的情况下植入广告,是未来广告的主要方式。

除了屏幕大小的限制,以APP为核心的生态也导致了媒体概念的转变。原来PC时代,网站是主要的媒体形式。而现在,每一款APP都在深挖一个领域,俗称“垂直领域”,有专做健身领域的,有专做母婴领域的,还有做同性交友的。使用这些APP的用户本身就是相同群体,因而具有更高的流量价值,自然吸引了不少广告主的目光。当然还有微信公共号等自媒体,依靠高水平的文章宣传自己,也得到了许多广告主的青睐。如何保证自己的APP和公共号能够黏住用户呢?优质的内容才是王道。

屏幕尺寸的变小与媒体多样化,都引发了广告主和媒体的思考。既要保证广告不影响用户体验,又要提供优质内容,似乎所有的道路都指向了同一个方向:内容即广告,让用户在阅读的同时就把广告给做了。这便是未来的广告了,原生广告。

原生广告中有什么计算内容可做呢?说一个最好想的,如何在一篇旅游游记中合理的插入当地酒店的信息呢,这就是原生广告平台要做的事情了。在原生广告模式下,媒体在投放广告时,更多的将考虑用户的体验。否则用户一怒之下卸载APP,取消关注。没了用户,广告主也不来了,这也便是闷声作大死了。

5. 上篇总结

事实上,这是一个混和的时代,各种广告模式并存。在我们打开一家门户网站的时候,我们并不能一眼看出到底哪个是合约广告的结果,哪个是竞价广告的结果,但是这些都不重要。能够认清数据的价值,理清三方关系,便是博主写这篇博文的初衷。如果特别想看到底有什么广告,那就给你看看CSDN页面上的广告形式吧。

CSDN

回顾计算广告的发展历史,纵使错综复杂,但究其根本,便是广告主、媒体与用户之间相互博弈之后达到的平衡状态。在传统广告踏入互联网大门之后,在利益最大化的驱动下,媒体通过受众定向技术引领广告进入合约广告时代;在精细化投放的使命与在线分配的矛盾下,媒体选择竞价方式将计算广告推入了发展的快车道;在广告主个性化投放的要求下,实时竞价映入眼帘,并衍生出更多的广告活动参与者;在移动互联大潮下,用户体验被尊为一切产品的出发点,使得原生广告成为未来广告的必然趋势。这些变革看似发生的恰到好处,合情合理,但是博主私认为,这是资本逐利的必然结果:为了能让媒体能够赚更多的广告费同时保证广告主的效果,这才会用到计算的力量,才顺带着推动了互联网技术的发展。在互联网人探索计算道路的时候,意外发现了数据的价值,并将之发扬光大。归根到底,所有的根源都来自于数据,广告主和媒体都挣钱了,用户必然是赔钱的那一个。免费的都是最贵的,用户在免费使用互联网服务的同时,留下的行为记录便是数据,各方利用这些数据,就可以刻画出你的性格、你的偏好、你的收入乃至你的一切。有了这些,就可以定向投放,就可以精准营销。你以为你在买东西时,是真的喜欢这个品牌吗?恐怕更多的原因,是你在互联网上见这个品牌见得更多而已。这也提醒我们互联网人,在追求技术卓越的同时,也要主动思考背后资本的力量,因为很多时候技术是由业务驱动的,而非技术本身。


5. 后话

本人才疏学浅,能力有限,文中涉及多数细节多为个人理解,有不当之处还请各位同学不吝指出。对相关内容感兴趣的同学,还请参阅刘鹏和王超老师所著《计算广告》,有更精准的定义、描述与更详细的讲解。

到这里,《计算广告小窥[上]您好,了解一下》就结束了。下半部分将集中介绍计算广告中的关键技术,具体解释受众定向的一般做法点击率预估DSP出价策略等相关计算问题。还会介绍一套通用的广告架构,并亲手实现一个最小广告系统。《计算广告小窥[下]这孙子怎么什么都知道》,敬请期待。

以上是关于ML学习分享系列_计算广告小窥[上]的主要内容,如果未能解决你的问题,请参考以下文章

ML学习分享系列_计算广告小窥[上]

[Machine Learning & Algorithm]CAML机器学习系列2:深入浅出ML之Entropy-Based家族

原 iBooker ML 群的资料打包分享

来自 Adwords 广告系列的 GA 事件中的每次获取成本?

计算广告丨学习资源整理

Coggle 30 Days of ML打卡广告-信息流跨域ctr预估