百货商场用户画像
上一节
下一节
1、项目背景与目标
本项目内容主要是基于Python的“百货商场用户画像描述与价值分析”,里面有详细的数据预处理、数据可视化和数据建模等步骤。同时,针对传统RFM模型进行了改进,构造了LRFMP模型来分析客户价值,挖掘客户价值的八个字段,并通过WordCloud形式展现了出来,可以对会员用户进行精准画像。
数据集分为两部分,.xlsx结尾的是会员信息表,.csv结尾的是销售流水表。其中,会员信息表共有将近19万条记录,销售流水表共有接近189万条记录,其包括2015-01-01到2018-01-03之间所产生的数据。
目标: 本项目主要围绕着“百货商店会员用户画像描绘与价值分析”内容进行,结合目前百货商场的数据情况,可以实现以下目标:
借助百货商场会员用户数据,对会员用户进行分群。
对不同的会员用户类别进行特征分析,比较不同类别会员用户的会员用户价值。
对不同价值的会员用户类别提供个性化服务,制定相应的营销策略。


2、数据探索与预处理
所需要的包及代码模版
需要安装wordcolud:
pip install wordcloud
import matplotlib
import warnings
import re
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
from sklearn.preprocessing import StandardScaler, MinMaxScaler
%matplotlib inline
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['axes.unicode_minus'] = False
matplotlib.rcParams.update({'font.size' : 16})
plt.style.use('ggplot')
warnings.filterwarnings('ignore')
项目完整来源链接:https://zhuanlan.zhihu.com/p/657762074
项目相关代码及数据
如果运行Kmeans报错:
KMeans: {AttributeError}‘NoneType‘ object has no attribute ‘split‘
解决办法:
pip install-upgrade threadpoolctl
升级到最新版本后代码运行成功

