4 大标签构建高质量用户画像

  用户画像能不能提升付费率?肯定能,问题是:怎么干?本篇文章就以小说阅读 APP 为案例,为大家讲解能提升付费率的用户画像应如何建立,感兴趣的朋友一起来看看吧。

  前几天就有同学 A,在面试的时候遇到这个问题。同学 A 举手:这题我会!构建 RFM 模型,把用户分成 27 类,然后重要价值客户(111)给予 VIP 资格,重要保持客户(011)要主动保持联系……熟练地背诵出 27 类的做法。

  首先,每种分析方法,是有特定业务场景限制的。从本质上看,网上盛传的 RFM 做法,只适合高频互动的零售电商业务的场景,比如耐用品、母婴、医疗、保健、游戏、影视娱乐等,都不适合 RFM。而这位同学正撞枪口上了:他面的是小说阅读 APP。

  小说业务,其付费的动力是高度内容驱动的。想让用户掏钱,至少得有内容让用户看得爽。想让用户看得爽,得知道用户喜欢什么样的内容题材。这是用户画像要解决的一个问题。

  同样是内容,小说又不同于短视频或者直播。用户的爽快感,不是直接被屏幕上扭来扭去的小姐姐或者喋声喋气的 乌鸡哥 激发的,而是在持续阅读过程中,在沉浸式的体验中获得的。

  这样就形成了一个逐步沉浸的转化过程:寻找内容→点击阅读→持续阅读→付费页面→付费→持续付费。因此,定位用户当前所处的阶段,引导用户向下一阶段发展,是用户画像要解决的第二问题。

  此时,可以进一步去想:从小说阅读 APP 里,能获取何种用户标签,构建用户画像了。

  一提到用户画像,很多同学又会说贯口一样说出:性别、年龄、职业、收入、爱好……只要做一个信息收集表,就能搞掂啦!

  但是,这些表单是建立在业务本身的刚需之上。没有这些信息,服务根本开展不了。所以这种表单信息能受到用户的理解和配合,采集难度也相对较低,复核起来也容易。

  更不要提其他涉及个人隐私信息,难道看小说还需要被查户口?不受用户理解,即使强行采集,数据也是假的。

  因此设计表单的时候,要保持克制,尽量找关键字段。对阅读而言,男女差异很大,且容易受到用户理解,因此可以在表单采集。并且男女,是个符合 MECE 的简单选项,不容易引起歧义。

  用户很容易引起歧义,比如玄幻 + 穿越的,算哪类?比如大女主算哪类?用户在有歧义的时候,就会乱填一通,收集回来的数据就有问题。这些细节看似琐碎,实则决定了基础属性标签的准确度。

  要定位用户当前所处的阶段,需要找能区分用户类型的最关键标签。既然目标是提升付费率,因此付费相关标签,就是第一重要的。根据用户付费记录,可以区分三个状态:从未付费 / 付费一本小说 / 付费 2 本及以上。引导方向也很清晰(如下图)。

  如果付费的小说已经完结了 / 断更了,就得及时推荐新内容;如果用户根本连看都看不下去,或者已经愤然弃坑,那也得另寻好内容推荐。因此得再考虑用户阅读行为标签。

  用户阅读行为对付费意义很重大。理论上,只有入坑的用户才会付费,还很有可能对更多其他感兴趣内容付费。对还没入坑的要尽快拖进坑里,已经脱坑的要防止流失。因此,区分出未入坑、入坑、脱坑状态,很重要。

  入坑 是对读者沉迷在某本小说情节的俗称。做标签定义可不能这么随便,要有具体的指标 + 计算公式 + 业务含义,才能算一个标签。

  用户如果入坑了,最起码的要求是在小说 APP 的登录时长、登录频次有一定保证,因此可以选用比如最近一周内登录次数 / 登录总时长,来区分用户平台活跃的轻、中、重(如下图)。

  第三,入坑、脱坑是一个动态过程。之前没有聚焦内容,之后有了,叫入坑;之前有聚焦的,之后没有,叫脱坑。因此构造标签的时候,不能只考虑当前状态,而是得关联上一个周期的状态,比如关联上一个周期,发现用户聚焦下降了,那么可以归纳为入坑。如果聚焦上升,可以归纳为脱坑(如下图)。

  很有可能,付费 / 不付费用户泾渭分明,付费的看完几页就付,不付的打死都不付。

  这些都有可能发生,而且会让数据分析变简单。但是在构造标签逻辑的时候,也要符合 MECE 方法,才能避免意外发生,这是专业数据分析人员与业务人员思考问题的本质区别:业务人员能直接抓最显眼的,数据则关注情况全面性与严谨性。

  上文有提到,直接收集兴趣会有各种问题。那还能怎么办呢?当然可以从用户行为中提炼兴趣。如果一个用户入坑了某个内容,那他肯定是对这个内容感兴趣的。

  这里的难点,在于区分:他到底对哪个点感兴趣。因为一个内容相关的静态标签太多了:作者、主题、风格、评论、是否热门、写法……还有很多无法标准化的部分。

  因此从一开始,就不能太指望兴趣标签做得特别精准,而是要结合小说的品类特点,把同款、交叉款单品选出来,找到贴近的单品即可。毕竟小说不是短视频,不需要 15 秒一切换。

  当兴趣偏好与付费行为交叉,还会产生一种可能:有一类用户就是坚持白嫖,有很多关联阅读行为,但是就是不付钱。此时可用优惠券测试,把其中价格敏感型与真正白嫖到底的区分开,从而形成价格偏好标签。

  有了以上基础的标签准备,最终输出策略时就可以像搭积木一般,针对用户需求,组合出各种策略,只要基础打得牢,出结果是手到擒来的事(如下图)。

  很多同学习惯了做网上的现成数据集。所谓的用户画像,大部分是现成的字段,尤其以直接收集的表单字段居多。

  这种现成的数据集练手很爽,可与实际情况差距非常大。实际工作中,即使能用表单采集,也得考虑采集过程中错误、造假、复核问题。

  更不用说,相当多数据标签需要通过分析计算 + 测试获得,需要一层层的构造,由简单到复杂。这些处理过程中技巧与手段,才是真正值钱的技能与能力,与大家共勉。

  接地气的陈老师,微信公众号:接地气学堂,人人都是产品经理专栏作家。资深咨询顾问,在互联网,金融,快消,零售,耐用,美容等 15 个行业有丰富数据相关经验。

  据官方消息,本届成都车展主题为“享蓉城·促产业·驭未来”,展期为8月26日~9月4日,将在中国西部国际博览城举办。

发表回复

您的电子邮箱地址不会被公开。

Previous post 大型铁矿石破碎机的常见类型
Next post 29 款儿童防晒霜比较试验:雅馨安娜、可瑞西等 3 款检出成分与标签标识不一致