RFM模型实战

news/2024/5/20 9:22:52 标签: 聚类, 数据分析

什么是RFM模型

RFM模型是衡量客户价值和客户创利能力的重要工具。该模型通过一个客户的近期购买行为、购买的总体频率,以及花了多少钱三项指标来描述该客户的价值状况。

如何构建RFM模型

最近一次消费 (Recency)

最近一次消费意指上一次购买的时间——用户上一次是什么时候下的单、用户上一次是什 么时候订购的服务,或在线下门店中用户上一次进店购买是什么时候。

消费频率 (Frequency)

消费频率是顾客在限定的期间内所购买的次数。一般而言,最常购买的用户,也是满意度/忠诚 度最高的顾客,同时也是对品牌认可度最高的用户。

消费金额 (Monetary)

消费金额是电商相关业务数据库的支柱,也可以用来验证“帕雷托法则”——公司80%的收 入来自20%的顾客。M值带有时间范围,指的是一段时间(通常是1年)内的消费金额。对于 一般电商店铺而言,M值对客户细分的作用相对较弱(因为客单价波动幅度不大)。

实战

假如我们有如下某餐饮店铺的用户RFM数据,只显示了前15条数据
在这里插入图片描述
我们通过聚类方法:K-Means聚类算法(非监督的学习算法)

算法过程:

  1. 从n个样本数据中随机挑选k个对象作为初始的聚类中心。
  2. 分别计算每个样本到各个聚类中心的距离,将对象分配到距离最近的聚类中。
  3. 所有对象分配完成后,重新计算k个聚类的中心。
  4. 与前一次计算得到的k个聚类中心比较,如果聚类中心发生变化,转至步骤2,否则转至步骤5
  5. 当质心不发生变化时,停止并输出聚类结果。

算法目的: 同一聚类内部距离最小化,不同聚类组间距离最大化

import pandas as pd
inputfile = '/content/consumption_data.xls'
outputfile = '/content/data_type.xls'
k = 3  # 聚类的类别
iteration = 500  # 聚类最大循环次数
data = pd.read_excel(inputfile, index_col = 'Id')  # 读取数据
data_zs = 1.0*(data - data.mean())/data.std()  # 数据标准化

from sklearn.cluster import KMeans
model = KMeans(n_clusters = k, n_jobs = 4, max_iter = iteration,random_state=1234)  # 分为k类,并发数4
model.fit(data_zs)  # 开始聚类

# 简单打印结果
r1 = pd.Series(model.labels_).value_counts()  # 统计各个类别的数目
r2 = pd.DataFrame(model.cluster_centers_)  # 找出聚类中心
r = pd.concat([r2, r1], axis = 1)  # 横向连接(0是纵向),得到聚类中心对应的类别下的数目
r.columns = list(data.columns) + ['类别数目']  # 重命名表头
print(r)

# 详细输出原始数据及其类别
r = pd.concat([data, pd.Series(model.labels_, index = data.index)], axis = 1)   # 详细输出每个样本对应的类别
r.columns = list(data.columns) + ['聚类类别']  # 重命名表头
r.to_excel(outputfile)  # 保存结果

def density_plot(data):  # 自定义作图函数
  import matplotlib.pyplot as plt
  plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
  plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
  p = data.plot(kind='kde', linewidth = 2, subplots = True, sharex = False)
  [p[i].set_ylabel(u'密度') for i in range(k)]
  plt.legend()
  return plt
pic_output = '/content/'  # 概率密度图文件名前缀
for i in range(k):
  density_plot(data[r[u'聚类类别']==i]).savefig(u'%s%s.png' %(pic_output, i))

这时我们可以得到K-means的输出结果
在这里插入图片描述
不同用户的RFM聚类类别结果
在这里插入图片描述
分群1的特点:R间隔分布较大,间隔分布在30至80天左右,消费次数集中在0~15次,消费金额在0-2000左右。精细化运营:老用户召回的方法,回归礼包什么的,加打优惠力度
在这里插入图片描述
分群2的特点:R间隔分布较小,间隔分布在0至30天左右,消费次数集中在10~30次,消费金额在500-2000左右。精细化运营:加大用户粘性,推荐办一个会员
在这里插入图片描述
分群3的特点:R间隔分布较小,间隔分布在0至30天左右,消费次数集中在0~12次,消费金额在0-1800左右。精细化运营:由于客单价偏低,针对用户购物链去推荐相应的产品
在这里插入图片描述


http://www.niftyadmin.cn/n/1517722.html

相关文章

亚马逊入驻商用户画像分析

什么是入驻商用户画像体系 像淘宝,京东,天猫,亚马逊,拼多多的叫平台方,在平台里面的阿迪达斯,耐克,鸿星尔克,卡尔米等叫入驻商。 用户的基本属性:性别、年龄、受教育程度…

亚马逊商品画像分析

商品画像分析 此次针对亚马逊曝光的裙子类目进行分析,即在亚马逊的裙子页面,进行翻页抓取曝光的数据 通过分析曝光价格的帕累托图可以让新上架的商品选择一个更容易畅享的价格,如下图所示,要是新上架的一个裙子定价在9美金&…

购物篮分析与产品定位分析

什么是产品关联度分析 关联分析是发现交易数据库中不同商品(项)之间的联系,主要应用于电商网站 推荐、线下零售门店商品摆放等场景中。 关联规则: 支持度(support):数据集中包含某几个特定项的…

电商数据分析——基于hive数仓,实现大数据分析

1. 需求 以电商数据为基础,结合hive数仓,实现大数据分析。 数据源可通过日志取得,数据清洗转换导入数据仓库,通过数仓中数据分析得到数据总结,用于企业决策。本项目基于以下表类进行电商数仓分析,分用户信…

大数据编程 —— 基于scala编写的 “宽带数据清洗” 项目Demo

宽带数据清洗 1 项目简介 每个用户接入宽带基于ADSL拨号拨号开始上网,当用户输入用户名密码之后验证通过,在AAA服务器就会生成一行日志记录,记录用户当前的操作信息,当用户下线的时候,AAA服务器判断用户断开连接会继…

Excel的52个必备函数

数据清洗类: 字符串提取: Left(text,[num_chars]) 从左边开始提取 参数:文本单元格,字符串长度Right(text,[num_chars]) 从右边开始提取 参数:文本单元格,字符串长度Mid(text,start_num,num_chars) 从指定位置提取 参…

LeetCode14.最长公共前缀 (简单题)

编写一个函数来查找字符串数组中的最长公共前缀。 如果不存在公共前缀,返回空字符串 “”。 示例 1: 输入:strs [“flower”,“flow”,“flight”] 输出:“fl” 示例 2: 输入:strs [“dog”,“racecar”…

Leetcode20.有效的括号 (简单)

给定一个只包括 ‘(’,’)’,’{’,’}’,’[’,’]’ 的字符串 s ,判断字符串是否有效。 有效字符串需满足: 左括号必须用相同类型的右括号闭合。左括号必须以正确的顺序闭合。 示例 1&…