目录

  • 1 第一章 大数据分析与Python
    • 1.1 课程介绍及考核要求
    • 1.2 课程PPT
    • 1.3 课程相关软件下载
    • 1.4 jupyter使用及python模块安装
    • 1.5 阿里在线jupyter指南
    • 1.6 数据分析基本操作
  • 2 第二章 Python基础操作
    • 2.1 学习目标
    • 2.2 课程PPT
    • 2.3 演示代码与数据
  • 3 第三章 Python常用库与可视化
    • 3.1 学习目标
    • 3.2 课程PPT
    • 3.3 演示代码与数据
  • 4 第四章 关联规则分析-Apriori模型
    • 4.1 学习目标
    • 4.2 课程PPT
    • 4.3 演示代码与数据
  • 5 第五章 决策树模型
    • 5.1 学习目标
    • 5.2 课程PPT
    • 5.3 演示代码与数据
  • 6 第六章 聚类算法
    • 6.1 学习目标
    • 6.2 课程PPT
    • 6.3 补充知识
    • 6.4 演示代码与数据
  • 7 第七章 神经网络
    • 7.1 学习目标
    • 7.2 课程PPT
    • 7.3 补充知识
    • 7.4 演示代码与数据
  • 8 第八章 表征学习
    • 8.1 学习目标
    • 8.2 课程PPT
    • 8.3 演示代码与数据
  • 9 第九章 案例实践(课程数据案例库)
    • 9.1 网络数据抓取
    • 9.2 百货商场用户画像
    • 9.3 上海餐饮数据分析
    • 9.4 电影推荐系统
    • 9.5 小红书服饰分析
    • 9.6 顾客市场细分
    • 9.7 支付宝交易数据分析
    • 9.8 房地产需求分析
    • 9.9 淘宝用户购物行为分析
    • 9.10 居民幸福感分析
  • 10 期末考核安排
    • 10.1 期末考核安排及课程论文模板
    • 10.2 UCI数据集
    • 10.3 阿里天池数据集
    • 10.4 科学数据银行
    • 10.5 更多数据源
  • 11 参考数据集
  • 12 拓展学习
    • 12.1 贝叶斯模型
      • 12.1.1 课程PPT
      • 12.1.2 演示代码与数据
    • 12.2 社会网络分析
      • 12.2.1 课程PPT
      • 12.2.2 演示代码与数据
    • 12.3 无标题
百货商场用户画像

1、项目背景与目标

本项目内容主要是基于Python的“百货商场用户画像描述与价值分析”,里面有详细的数据预处理、数据可视化和数据建模等步骤。同时,针对传统RFM模型进行了改进,构造了LRFMP模型来分析客户价值,挖掘客户价值的八个字段,并通过WordCloud形式展现了出来,可以对会员用户进行精准画像。

数据集分为两部分,.xlsx结尾的是会员信息表,.csv结尾的是销售流水表。其中,会员信息表共有将近19万条记录,销售流水表共有接近189万条记录,其包括2015-01-01到2018-01-03之间所产生的数据。

目标: 本项目主要围绕着“百货商店会员用户画像描绘与价值分析”内容进行,结合目前百货商场的数据情况,可以实现以下目标:

  • 借助百货商场会员用户数据,对会员用户进行分群。

  • 对不同的会员用户类别进行特征分析,比较不同类别会员用户的会员用户价值。

  • 对不同价值的会员用户类别提供个性化服务,制定相应的营销策略。




2、数据探索与预处理

所需要的包及代码模版

需要安装wordcolud:

pip install wordcloud

import matplotlib
import warnings
import re
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
from sklearn.preprocessing import StandardScaler, MinMaxScaler
%matplotlib inline
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['axes.unicode_minus'] = False
matplotlib.rcParams.update({'font.size' : 16})
plt.style.use('ggplot')
warnings.filterwarnings('ignore')

项目完整来源链接:https://zhuanlan.zhihu.com/p/657762074

项目相关代码及数据


如果运行Kmeans报错:

KMeans: {AttributeError}‘NoneType‘ object has no attribute ‘split‘


解决办法:

pip install-upgrade threadpoolctl

升级到最新版本后代码运行成功