3 数据分析模式
细分: 零售或电商中(其它领域也有类似的场景),商品和客户的数量会比较多,无法实现单体分析,通常会基于某类规则对商品或客户进行有限的分类, 然后观察分类的数据表现,分类规则和参考值灵活多变。
多维度灵活组合: 维度是数据分析中基本的概念,是观察数据表现的一种视角,例如:以地区/商品类为视角,观察每个地区的客户重复购买情况,或者叠加时间维度, 观察每个地区、每个品类及每个月的数据表现,实时使用时,维度和聚合指标的组合非常多,不同的使用角色对维度的关注程度也不一样。维度的定义可能是原生属性, 例如:性别、颜色等,也有可能是派生属性,例如:年龄段( Age Group )、价格带( Price Range )等。
增长率: 增长率主要是基于时间维度,观察聚合指标的变化情况,有时也会组合高层次维度。部分领域还会出现基于时间维度上更多的计算方法,例如: 对聚合指标的移动平均、累加等分析方法,这类方法与 增长率 较为相似,不再赘述。
跨维度聚合计算: 跨维度聚合计算主要出现在占比分析的场景,例如:计算每个省份销售额占全国销售额的比例,有时也会出现多层次占比分析,例如: 同时观察省份占比和城市占省份的比例。
上述分析模式为抽象的分析方法,相比 SQL 中的分析方法还是具体的多,更贴近实际领域。在不同领域中基于上述方法,还可以衍生出很多不同的分析实践,例如: 留存分析、同环比分析、RFM 、复购分析等。
基于上述抽象的数据分析方法封装相应的函数或表达式,将会大大降低数据分析师的日常工作量,只需要设计指标涉及的字段和聚合方式即可, 不再关注具体的技术细节,也不再关注统计结果的准确性。