网易云音乐分析报告——音乐以人为本

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了网易云音乐分析报告——音乐以人为本相关的知识,希望对你有一定的参考价值。

参考技术A 一、网易云音乐产品概况(云音乐现在是啥样)

1.产品定位:

中国最大的音乐社区、开放平台,独特的以用户为中心的音乐生态圈

2.目标受众:

有一定音乐素养的、较高教育水平、较高收入水平的年轻人

群唱片公司、独立音乐人、歌手、DJ

3.用户数量:

2013-2014,突破5500万;2015年7月突破一亿

4.官方说明:

网易云音乐,1亿乐迷为之狂热的音乐APP!2014年连续斩获【中国十佳移动互联网应用】、【百度移 动2014“年度优秀视觉设计奖”】、【豌豆荚“设计奖“】,【2014中国软件风云榜“编辑推荐奖”】,“知乎”上口碑最佳音乐APP。

5.业内情况:

talking data的披露数据显示,2015年1月至5月,网易云音乐市场份额增长率位列行业第一。百度指数数据亦显示,2015年1月至5月,网易云音乐百度指数增长率位居前列。

2015年主流音乐应用用户满意度位居业内第三;移动音乐用户最常用的音乐应用位居业内第五。(DCCI2015《中国移动音乐应用用户调研》)

2016年3月份中国APP活跃用户排行榜,网易云音乐跃升业内第三,排在酷狗、QQ音乐之后,首次进入Top50榜单。(艾媒咨询《2016年中国APP活跃用户排行榜(3月份Top450)》)

2015年上半年整体互联网用户对音乐客户端的热议度位居行业第二,QQ音乐之后;整体互联网用户对音乐客户端主动搜索行为位列行业第六,但增长率高达315.5%。(易观智库《中国移动音乐用户专题研究报告2015》)

6.用户评价:

主流曲库(边缘曲库次于虾米,且录入信息时常有误)相对较全、设计出众(模块清晰)、对一般听众来说推荐项目深得人心(发烧友表示从来不相信人工或智能推荐),音质好(320kbis/s音质免费,但有一些曲目音质虚假)、设备覆盖率高(Windows Phone版好评如潮)

二、网易云音乐产品生态结构(云音乐希望达到何处)

在网易云音乐的官方说明中,提到这么几点:①国内首个以“歌单”作为核心架构的音乐APP;② 强大的【乐评】氛围;③用户自上传【主播电台】④过千名大牌明星、专业音乐人、DJ进驻;⑤国内最大的曲库团队、反馈最快最及时的客服团队。这是云音乐构建其以用户为中心音乐生态圈的基本结构。

虽然我个人不喜张嘴闭嘴谈及生态,但网易云音乐确实逐渐形成了独特的气质和用户习惯,这是生态的基础。何为生态?一句话简单解释——某地民风彪悍,外来者大都“入乡随俗”。而听歌看评论、分享你的歌单成了网易云音乐用户的“习俗”。

2015年7月,网易云音乐用户过亿时,透露了几个数据:云音乐当前入驻的明星超过1200位,收录音乐500万首,用户自主创建的歌单6400多万个,累计产生1.2亿条乐评和2亿次的音乐分享,音乐社交生态圈日渐成熟。可见,在云音乐快速成长的阶段,音乐社区为其赢来了诸多用户,口碑传播效应十分强劲。

但在基本结构层级中,没有哪一点是关键,关键是随着时间变化的。三石叔在最初发布这款产品,讲到自己有个期待是,一些音乐人不用求爷爷告奶奶地发唱片。云音乐在大生态圈的构建上,音乐社区可以趁着移动互联网时代稳步扩大并走出自己的路,即便遇到不顺畅但也可以自如。但音乐开放平台方面面临的是整个市场的生产者,机遇和困难一样多。

图1:云音乐的生态结构

三、网易云音乐产品结构&产品形态(云音乐做了什么)

通过对网易云音乐生态结构的分析,对云音乐产品架构和功能的分析将聚焦在音乐社区和开放平台的具体实现上,即:①何为以“歌单”作架构;②【乐评】氛围有多强大;③电台产品具体情况;④专业音乐人在应用内的形态。

图2:云音乐版本架构图

(本页所有无码高清大图的入口:放大浏览器)

图3:云音乐产品/服务形态

自2013年开始,业内对正版音乐的保护力度越来越大。2015年国家版权局发布了《关于责令网络音乐服务商停止未经授权传播音乐作品的通知》,通知要求,各网络音乐服务商停止传播未经授权传播音乐作品,并于2015年7月31日前将未经授权传播的音乐作品全部下线。QQ音乐、酷狗、网易云音乐和阿里音乐之间的版权诉讼此起彼伏,音乐以曲库为本是音乐APP的主流思想。

曲库就像一个蛋糕胚,能从13年走到今天的各家大大小小也都分到了自己的部分,且版权问题一直是五十步笑百步,几乎没谁独善其身。面对上百万甚至上千万的曲库,如何梳理并提供给用户是流媒体播放器的根本,也是一切功能的具体体现的初衷。

在曲库基础梳理、分类和检索的功能实现上,市场上常见音乐APP你学我我学你大家学学老媒体,基本上大同小异,线索基本包括:歌手、歌曲名称、专辑名称、歌词、歌单名称,基本都支持模糊搜索、历史搜索和热门搜索等功能。

但对曲库梳理划分,又可分为面向音乐和面向用户两种类型(也有一些功能是面向双方)。举个🌰,我现在无业所以心情大好,某APP提供了曲库中情感分类,我可以找到“快乐”相关的音乐,这是面向用户;我对西方摇滚音乐十分喜爱,某APP提供了精细的专辑分类,我可以找到欧美-摇滚-90年代的录音室专辑,这是面向音乐;我也不知道听什么,决定找找专业音乐媒体的推荐,某APP提供了全球各类榜单,这是面向双方。

网易云音乐以“歌单”为架构体现在用户对曲库进行检索这一基础操作路径上。以“歌单”为架构,即在曲库流通时,歌单形式是主流,曲库在用户端(我的音乐)落地时,歌单是唯一形式。以“搜索歌曲及播放”一般流程为例,路径可达8个页面(首页--搜索页--搜索结果页--歌手详情页--专辑详情页--播放页--我喜欢的音乐歌单页--我的音乐)。

在这个路径中,歌单操作超过5次,除非放弃这首曲目,保留它的唯一形式就是放入歌单。

图4:用户检索曲库路径图

云音乐其他曲库分类、检索功能只会比这个路径更早见到歌单。例如,直接进入歌单的入口有:首页导航栏第二位置、首页发现音乐的推荐歌单栏目;首页发现音乐中,轮播图下方有新歌榜,而云音乐内所有音乐榜单都是歌单形式存在;用户以语种、风格、情感、主题筛选曲库是,也直接面对歌单系统。

再以云音乐内智能产品“私人FM”为例,最初用户得到的信息并非以歌单形式组织,最终这个信息会有5/6的几率转化为歌单。

图5:云音乐内智能产品之一——私人FM,“发现音乐”与“我的音乐”信息流程

云音乐以“歌单”为架构,即在曲库流通时,歌单形式占了绝大部分,曲库在用户端(我的音乐)落地时,歌单是唯一形式。2015年用户过亿时网易透露,应用内用户自主创建的歌单达6400多万个(除了做一个音乐流窜,我怎么才能绕开你的歌单?)

网易云音乐是鼓励登陆的设计,未登录时没有任何功能。当利用游客身份登陆时,无法操作账号和朋友两个模块及其相关功能,我的音乐和发现音乐模块及其功能也都是基于当前设备本地记忆。

图1中展示的四个基础模块,大致可以归纳为以下关系(NO Money账号,NO Friends,NO Music,真是人生哲理):

图6:云音乐主要功能模块关系

云音乐提供五种登陆方式:手机号、微信、QQ、新浪微博和网易邮箱(游客登陆将失去朋友和应用内所有评论、转发和赞的功能),与常见同类型应用基本无二致。在音乐APP中,网易云音乐是唯一将社交功能平置于其他功能的应用,而社交功能“朋友”是能否参与“强大【乐评】”的唯一开关。参考图3云音乐产品形态,“乐评”的入口为以下几点:

1.朋友页面

   用户动态

2.播放页

   歌单曲目

   私人FM

   电台

   MV

   超级面对面视频

   音乐后现场视频

3.详情页

   歌单

   专栏(网页)

   探索频道

   一周热评

   网易音乐人

在这些页面中,评论都占据极佳展位,而非其他APP常见的收纳在“更多功能”里面。这种设定,也直接带来了——2015年7月,网易宣布用户过亿时透露的数据之一“1.2亿条乐评和2亿次的音乐分享”。

主播电台作为云音乐平台建设的主要功能,第一入口放置在发现音乐的导航栏和发现页面栏目中。目前包含:明星做主播、创作翻唱、脱口秀、美文读物、音乐故事、情感调频、有声小说、人文历史、外语世界、二次元、旅途城市、娱乐影视、3D电子、校园教育、亲自宝贝和广播剧16个类型,基本涵盖了电台的一般内容。

目前从订阅数量来看,网易官方出品的明星会客室、从新闻客户端脱生的网易轻松一刻和新闻7点整,分别达到201W、197W和188W的订阅量,远远超过一般用户主播电台的订阅量。

为了挖掘主播电台的UGC能力,云音乐采取了:

1.在首页发现音乐的主播电台栏目,会向用户展示6个官方选荐的用户主播电台;

2.在主播电台页面,有精彩节目推荐、精选电台-订阅更精彩和热门电台三个栏目展示用户主播电台;

3.在电台排行榜页面,利用节目(7天内发布热度最高节目,热度以节目播放、赞、分享数量总合计算)、新晋电台(3个月内创建热度最高电台,热度以电台播放、订阅、分享数量总和计算)、最热电台(应用内热度最高的电台)导航栏向用户展示用户主播电台;

4.在每个电台分类中,展示最新流行(官方筛选优秀新电台、上升最快电台)

专业音乐人方面,云音乐提供两种途径:①注册成为网易音乐人;②入驻网易云音乐。

网易音乐人具体体现是网易的独立音乐人招募计划(目前个人关注的音乐人已入驻的有左小祖咒、李志、陈粒、痛仰乐队、五条人乐队等)。该计划主要是为音乐人提供数字音乐推广发布、销售等服务。

2015年网易云音乐独家发布独立音乐人陈粒单曲数字专辑《爱若》,以1元一张的价格在线售卖,一个月内销售数量突破10万张。而这是陈粒的首张付费数字专辑,也是独立音乐人领域的首张付费数字专辑。

网易云音乐在2015年7月透露入驻的明星超过1200位。入驻的形式,即注册成为明星用户,用户在朋友模块可以对其关注、访问其个人页面(个人动态、粉丝数量、主播电台、个人歌单)、访问其歌手页面和发送私信。

目前云音乐的明星数量为1342人,可见从去年7月到现在,增长十分缓慢。专业音乐人在应用内的主动操作有三个方式:通过私信向关注用户发送单曲和专辑、主持电台和制作歌单。专业音乐人的身影会还出现在,参与云音乐官方出品的电台(明星会客室)、视频节目(超级面对面、音乐后现场)这两种的方式中。

另外一方面,网易云音乐在15年的重要活动主要有:“中韩音乐大战”和独立音乐人李志的合作。

四、网易云音乐APP的优、劣势

这里占位符,后续加上

干货网易云音乐歌单的推荐算法解析

网易云音乐的歌单推荐算法是怎样的呢?最近有很多人关心这个问题。调查了一些网易云音乐的重度患者,小咖带你来看一些路过大神的精辟分析。


分析一:

“商品推荐”系统的算法( Collaborative filtering )分两大类:

第一类,以人为本,先找到与你相似的人,然后看看他们买了什么你没有买的东西。这类算法最经典的实现就是“多维空间中两个向量夹角的余弦公式”;

第二类, 以物为本直接建立各商品之间的相似度关系矩阵。这类算法中最经典是'斜率=1' (Slope One)。amazon发明了暴力简化的第二类算法,‘买了这个商品的人,也买了xxx’。

我们先来看看第一类,最大的问题如何判断并量化两人的相似性,思路是这样 --

例子:有3首歌放在那里,《最炫民族风》,《晴天》,《Hero》。

A君,收藏了《最炫民族风》,而遇到《晴天》,《Hero》则总是跳过;
B君,经常单曲循环《最炫民族风》,《晴天》会播放完,《Hero》则拉黑了
C君,拉黑了《最炫民族风》,而《晴天》《Hero》都收藏了。
我们都看出来了,A,B二位品味接近,C和他们很不一样。

那么问题来了,说A,B相似,到底有多相似,如何量化?

我们把三首歌想象成三维空间的三个维度,《最炫民族风》是x轴,《晴天》是y轴,《Hero》是z轴,对每首歌的喜欢程度即该维度上的坐标,并且对喜欢程度做量化(比如: 单曲循环=5, 分享=4, 收藏=3, 主动播放=2 , 听完=1, 跳过=-1 , 拉黑=-5 )。

那么每个人的总体口味就是一个向量,A君是 (3,-1,-1),B君是(5,1,-5),C君是(-5,3,3)。 (抱歉我不会画立体图)

我们可以用向量夹角的余弦值来表示两个向量的相似程度, 0度角(表示两人完全一致)的余弦是1, 180%角(表示两人截然相反)的余弦是-1。

根据余弦公式, 夹角余弦 = 向量点积/ (向量长度的叉积) = ( x1x2 + y1y2 + z1z2) / ( 跟号(x1平方+y1平方+z1平方 ) x 跟号(x2平方+y2平方+z2平方 )

可见 A君B君夹角的余弦是0.81 , A君C君夹角的余弦是 -0.97 ,公式诚不欺我也。

以上是三维(三首歌)的情况,如法炮制N维N首歌的情况都是一样的。
假设我们选取一百首种子歌曲,算出了各君之间的相似值,那么当我们发现A君还喜欢听的《小苹果》B君居然没听过,相信大家都知道该怎么和B君推荐了吧。

第一类以人为本推荐算法的好处我想已经很清楚了,那就是精准!代价是运算量很大,而且对于新来的人(听得少,动作少),也不太好使,所以人们又发明了第二类算法。

假设我们对新来的D君,只知道她喜欢最炫民族风,那么问题来了,给她推荐啥好咯?

如图,推荐《晴天》!

呵呵,第二类算法的好处大家也看出来了,简单粗暴好操作(也适合map-reduce),可精度差了点。

所以,各家网站真正的推荐算法,是他们在综合上述两类算法的基础上,各自研制并且不断地改进调节的,外人不得而知! ^_^

多谢 @刘彦彬 给了一个非常专业的评论 ,不贴出来可惜了。

“这个只能说是理论基础。歌曲不考虑热门冷门,同时不考虑用户数和歌曲数计算复杂度的话第一一天内离线数据计算不完的(当然网易云音乐用户量小全量暴力计算当我没说),实际应用起来复杂很多了。现在的推荐系统并不存在一种算法通吃,除了算法上的问题,还需要考虑基础数据的影响因素,比如两张歌单有多少歌曲重合,歌单的质量是怎么样的。”

我上一帖也说了,“向量夹角余弦” 解决的是“量化顾客口味相似度”的问题(是最经典的解法,也有别的解法),不是有了它就能轻易实现第一类算法的,难处在后面咯。

我不是干‘CF/算法/数据挖掘/互联网’的,只是几年前偶尔瞄到过这方面文章被惊艳了一下,见到这题就随口抖了个机灵,然后被评论区几位带板凳来的朋友给推上来了 ^_^

既然大家都这么有兴趣,我在来抛块砖,说说有了理论基础之后咋整”的思(nao3)考(dong4)。

继续第一类算法的话题,目标“每日歌曲推荐”(其实题主感兴趣的是这个吧,旁边‘根据你喜欢的xxx推荐的yyy歌单’我觉得不咋样)。

首先就是如何定维度。直接用‘歌’当维度是不行的,第一是太多了算不过来,第二维度数一直猛涨也不是个事。

用‘歌单’或者‘专辑’,‘演唱/演奏者’呢?也有类似的困难。说到这里大家应该都意识到了,咱不是还有‘tag’嘛!

云音乐初期,tag是可以由大家自己填的,我记得我填过‘莫扎特’,‘钢协’,‘交响’这样的tag,现在都不见了吧。一段时间之后,tag无法自填了,只能从云音乐给的tag lib中选,这肯定有原因的。

我的推测就是,他们需要用tag来当作维度,所以不希望tag数经常变化

第一阶段,他们需要搜集用户的输入来做出tag lib。

第二阶段,他们构建了多维度空间,就不希望再动维度了,因此关闭了自填tag的功能。

假设就用tag做为维度,那么第二个难处在于,维度上的'刻度'必须有正有负才好使,用户没有机会直接表达对tag的好恶(不能收藏,播放,跳过一个tag),如何定刻度呢。

我认为每一首歌背后是有其所属tags这个属性的,这个属性在UI上看不到很可能是因为比较容易引起口水。

歌往往隶属于很多歌单,而那些歌单都是有tags的,根据那些歌单的播放数收藏数分享数可以决定其“权威性”,取“权威性”高的歌单的tag,就可以得到每首歌的tag属性。

然后用户在表达对一首首歌的好恶的时候,其实就不知不觉地影响了他在相应维度上的刻度。

假设维度和刻度都这样解决,那么我们可以对每个用户做出“口味向量”了,接下来的难处是,啥时候算/如何保存“用户相似性”?所有用户两两算一下相似性,存为一个NxN的矩阵,这种事情不是闹这玩的。

其实到了这一步,不考虑‘以人为本’,直接根据我喜欢的tag,从各tag里挑一些人气高的,或者蹿升快的歌来推荐也算是能交差了。

不过那样的话,就容易同质化,也就不易让用户‘惊艳’了。让我们继续沿着第一类算法的思路琢磨琢磨。

多维度空间还有一大好处是,有‘像限’这种的概念,比如我们可以粗暴地假设,和我同一个像限的人,就是和我‘相似’的人,如果因为维度太多,或者初期用户太少等原因找不到同像限的人, 还可以去‘相邻’的像限找嘛。

OK,假设我们根据tag以及自己的象限,找到了一批和自己‘气味相投’的人。再丛这批人中,选几个‘和我夹角余弦’最大(再综合一下个人名声比如星标,粉丝数,和我的互动度等,更好)的人,从他们听过而我没听过的歌中,再选一批 他们喜欢,或者他们新听到,新收藏,或者总人气高的等等,就可以说是“根据我的口味生成”的“每日歌曲推荐”了。


分析二:

这里我想给大家介绍另外一种推荐系统,这种算法叫做潜在因子(Latent Factor)算法。这种算法是在NetFlix(没错,就是用大数据捧火《纸牌屋》的那家公司)的推荐算法竞赛中获奖的算法,最早被应用于电影推荐中。这种算法在实际应用中比现在排名第一的 @邰原朗 所介绍的算法误差(RMSE)会小不少,效率更高。我下面仅利用基础的矩阵知识来介绍下这种算法。

这种算法的思想是这样:每个用户(user)都有自己的偏好,比如A喜欢带有小清新的、吉他伴奏的、王菲等元素(latent factor),如果一首歌(item)带有这些元素,那么就将这首歌推荐给该用户,也就是用元素去连接用户和音乐。每个人对不同的元素偏好不同,而每首歌包含的元素也不一样。我们希望能找到这样两个矩阵:

一,用户-潜在因子矩阵Q,表示不同的用户对于不用元素的偏好程度,1代表很喜欢,0代表不喜欢。比如下面这样:

【干货】网易云音乐歌单的推荐算法解析

二,潜在因子-音乐矩阵P,表示每种音乐含有各种元素的成分,比如下表中,音乐A是一个偏小清新的音乐,含有小清新这个Latent Factor的成分是0.9,重口味的成分是0.1,优雅的成分是0.2……

【干货】网易云音乐歌单的推荐算法解析

利用这两个矩阵,我们能得出张三对音乐A的喜欢程度是:张三对小清新的偏好*音乐A含有小清新的成分+对重口味的偏好*音乐A含有重口味的成分+对优雅的偏好*音乐A含有优雅的成分+……

【干货】网易云音乐歌单的推荐算法解析【干货】网易云音乐歌单的推荐算法解析

即:0.6*0.9+0.8*0.1+0.1*0.2+0.1*0.4+0.7*0=0.69

每个用户对每首歌都这样计算可以得到不同用户对不同歌曲的评分矩阵【干货】网易云音乐歌单的推荐算法解析
。(注,这里的破浪线表示的是估计的评分,接下来我们还会用到不带波浪线的R表示实际的评分):

【干货】网易云音乐歌单的推荐算法解析

因此我们队张三推荐四首歌中得分最高的B,对李四推荐得分最高的C,王五推荐B。

如果用矩阵表示即为:

【干货】网易云音乐歌单的推荐算法解析

下面问题来了,这个潜在因子(latent factor)是怎么得到的呢?

由于面对海量的让用户自己给音乐分类并告诉我们自己的偏好系数显然是不现实的,事实上我们能获得的数据只有用户行为数据。我们沿用 @邰原朗的量化标准:单曲循环=5, 分享=4, 收藏=3, 主动播放=2 , 听完=1, 跳过=-2 , 拉黑=-5,在分析时能获得的实际评分矩阵R,也就是输入矩阵大概是这个样子:
【干货】网易云音乐歌单的推荐算法解析

事实上这是个非常非常稀疏的矩阵,因为大部分用户只听过全部音乐中很少一部分。如何利用这个矩阵去找潜在因子呢?这里主要应用到的是矩阵的UV分解。也就是将上面的评分矩阵分解为两个低维度的矩阵,用Q和P两个矩阵的乘积去估计实际的评分矩阵,而且我们希望估计的评分矩阵【干货】网易云音乐歌单的推荐算法解析

【干货】网易云音乐歌单的推荐算法解析

和实际的评分矩阵不要相差太多,也就是求解下面的目标函数:


【干货】网易云音乐歌单的推荐算法解析


这里涉及到最优化理论,在实际应用中,往往还要在后面加上2范数的罚项,然后利用梯度下降法就可以求得这P,Q两个矩阵的估计值。这里我们就不展开说了。例如我们上面给出的那个例子可以分解成为这样两个矩阵:

【干货】网易云音乐歌单的推荐算法解析

这两个矩阵相乘就可以得到估计的得分矩阵:

【干货】网易云音乐歌单的推荐算法解析


将用户已经听过的音乐剔除后,选择分数最高音乐的推荐给用户即可(红体字)。


在这个例子里面用户7和用户8有强的相似性:



从推荐的结果来看,正好推荐的是对方评分较高的音乐:



文章来源:知乎


欢迎大家关注pmcaff公众账号,近期会有产品经理免费培训课。

1.请回复公众账号“免费培训”查看详情。

2.点击原文链接可直接参与报名。


pmcaff合作媒体:Chinaz

更多精彩推荐


回复“31”——【干货】腾讯产品大拿告诉你,用户体验是这样设计的!!!

回复“32”——【专访】小米产品经理颠覆早教行业,欲送给孩子1000万美金的人生

回复“33”——【产品】阿里产品经理内训:能力模型解读

回复“34”——【重温经典】张小龙:微信背后的产品观

回复“35”——【专访】PP租车张丙军:“打虎亲兄弟“,好团队才能书写互联网传奇

回复“36”——【干货】产品经理的需求管理

回复“37”——【干货】APP解构重构,让你用户不再流失

回复“38”——【干货】产品经理解决问题七步法则

回复“39”——【运营】你不知道的HTML5的概念、方法和推广实战指南

回复“40”——【干货】从苹果ios8的发布,来细数那些精彩纷呈的引导页


文章推荐可直接回复公众账号或者发送至xiaoxi@pmcaff.com,可根据推荐质量将推荐人邀请至pmcaff智囊团预备群中,原创或者推荐均可,欢迎来稿~


pmcaff愿见证你的成长


以上是关于网易云音乐分析报告——音乐以人为本的主要内容,如果未能解决你的问题,请参考以下文章

干货网易云音乐歌单的推荐算法解析

网易云音乐产品体验报告

第二次作业:网易云音乐产品分析

网易云音乐是一款怎么样的产品?

网易云音乐案例分析

软工书面作业1——分析网易云音乐的创新