游戏数据挖掘特征构造+后处理相关实践经验
Posted 一只小鱼儿
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了游戏数据挖掘特征构造+后处理相关实践经验相关的知识,希望对你有一定的参考价值。
游戏有很多类型,比如slg,moba,rpg等等。不同类型的游戏加上不同的业务场景导致在训练模型时所用到的特征也会有所不同,这篇文章记录一下特征工程方面的相关实践经验,持续更新ing。
本次介绍相对通用的一些特征,主要分为基础信息,活跃,社交,付费几大类,在各个场景中具备比较高的复用性。
基础信息
账号id,服务器id,地理位置,设备信息等。
活跃信息
活跃情况:包括在线时长,在线天数,获取游戏经验,游戏道具,金币数量等。
生命周期:离线天数,角色等级,最近登录日期,创建时长,在线时长,经验值,角色创建日期等。
活跃规律:工作日,周末,星期几,上午,下午,晚上,凌晨在线时长等。
社交信息
队伍/帮会/好友中的活跃(比如发言,带队,赠送礼物,分享)/社交影响力(pr值)等。
付费信息
付费意愿:代币消费额,付费天数,vip等级,首次/最近一次/倒数第二次付费日期/距今天数,浏览/点击/购买/转化等。
付费偏好:最高付费道具类型/付费场景,折扣敏感等。
备注
1. 部分特征可以按照时间窗口/数值分箱/频次/最高/最低/平均/方差/排行百分比等统计方式进一步细化。
2. 利用上述特征进一步构建二阶特征,比如利用角色等级/在线时长,总付费/角色等级,最近一周在线时长/总时长,最近付费/总付费来得到一些比较特殊的信息,比如衡量玩家近期付费意愿是否下滑,是否是滚服账号等。
3. 对于道具推荐,可以考虑对消耗道具,拥有道具构建embedding对用户进行表征,实践中效果是比较明显的。
4. 从业务指标来说,特征工程是一方面,预测结果后处理也很重要,比如按照购买率*物品价格进行重排可以优化代币回收指标,还有适应用户近期付费习惯的改变,比如大超R近期却不愿意消费那么不应该推送过于昂贵的物品,小R近期付费意愿比较高可以适当提高物品价格等策略,实践下来也是十分有效的。
5. 部分情况下,需要考虑用户群体差异和产品运营周期,比如正常玩家和回流玩家的游戏追求不同,长草期和活动日用户的消费习惯也存在较大差异,模型需要能适应这类情况,比如加入相关特征标记或者是分开训练。
以上是关于游戏数据挖掘特征构造+后处理相关实践经验的主要内容,如果未能解决你的问题,请参考以下文章