『数据分析』使用python进行同期群分析

『数据分析』使用python进行同期群分析

发布时间:2024-04-22 00:13:15    作者:rng电子竞技俱乐部官网

  同期群(Cohort)的字面意思(有共同特点或举止类同的)一群人,比如不同性别,不同年龄。

  在《精益数据分析》中的第2章 创业的记分牌 中介绍了三种分析方法(市场细分、同期群分析以及A/B测试),其中关于同期群分析的讨论能够在一定程度上帮助我们快速了解它的应用场景。

  产品会随着你的开发和测试而不断迭代,这就导致在产品发布第一周就加入的用户和后来才加入的用户有不一样的体验。比如,每个用户都会经历一个生命周期:从免费试用,到付费使用,最后不再使用。同时,在这期间里,你还在不停地对商业模式做调整。于是,在产品上线第一个月就“吃螃蟹”的用户势必与四个月后才加入的用户有不一样的上手体验。这对用户流失率会有什么影响?我们用同期群分析来寻找答案。

  每一组用户构成一个同期群,参与整个试验过程。通过比较不同的同期群,你可以获知:从总体上看,关键指标的表现是否越来越好了。

  产品会随着你的开发和测试而不断迭代,这就导致在产品发布第一周就加入的用户和后来才加入的用户有不一样的体验。比如,每个用户都会经历一个生命周期:从免费试用,到付费使用,最后不再使用。同时,在这期间里,你还在不停地对商业模式做调整。于是,在产品上线第一个月就“吃螃蟹”的用户势必与四个月后才加入的用户有不一样的上手体验。这对用户流失率会有什么影响?我们用同期群分析来寻找答案。

  每一组用户构成一个同期群,参与整个试验过程。通过比较不同的同期群,你可以获知:从总体上看,关键指标的表现是否越来越好了。

  结合到用户分析层面,比如不同月份获取的用户,不同渠道新增用户,具备不同特征的用户(比如微信里每天至少和10个以上朋友微信的用户)。

  同期群分析(Cohort Analysis),将这些具有不一样特征的人群作对比分析,以发现他们在时间维度下的行为差异。

  对比 同一 同期群群体不同体验周期(生命周期)的数据指标,发现长线体验的问题

  我们在进行同期群分析的时候,大概能划分为2个流程:确定同期群分组逻辑和确定同期群分析的关键数据指标。

  关于关键数据指标,需要是基于时间维度下的比如留存、营收、自传播系数等等。

  下面是某电商的运营数据,我们将以该数据演示用python进行同期群分析。

  数据是某电商用户付费日志,日志字段包含日期、付费金额和用户id,已脱敏处理。

  这里只按照用户的初始购买月份进行分组,如果日志包含的分类字段更多(比如 渠道、性别或者年龄等),可优先考虑更多种分组逻辑。

  在本次的分析中,留存率的具体计算方式为:+N月留存率=+N月付款用户数/首月付款用户数

  要从从人均付款金额角度考虑,需要仔细考虑同期群基期这个整体。具体计算方式是先计算各月的付款总额,然后除以基期的总人数:

  可以看到,12月份的同期群首月新用户人均消费为703.43元,然后逐月递减,到+4月后这些用户人均消费仅11.41元。而随着版本的迭代发展,新增用户的首月消费并没有较大提升,且接下来的消费趋势反而不如12月份。由此可见产品的发展受到了一定的瓶颈,需要思考增长营收的出路了。

  一般来说, 通过同期群分析可以比较好指导我们后续更深入细致的数据分析,为产品优化提供参考。

  对于Styler类型,我们大家可以调用render方法转化为网页源代码,通过以下方式即可将其导入到一个网页文件中:

  如果你的电脑安装了谷歌游览器,还能安装dataframe_image,将这个表格导出为图片。

相关新闻推荐

在线客服 :

服务热线:0523-84865312

电子邮箱: jssj@jssjjd.com

企业地址:靖江市斜桥镇江平路19号

rng电子竞技俱乐部官网 位于制造业基地的长三角产业带中心——美丽的滨江之城——靖江,交运顺捷,政通人和。组建成立于一九九七年,注册资本:人民币5009万元,主要从事医药、卫生、电子、环保、轻工、

Copyright © 2002-2017 rng电子竞技俱乐部中心官网_rng最新战队成员名单 版权所有