关注公众号:『』
回复: 即可获取数据下载。
论文辅导或算法学习可以通过公众号滴滴我
本项目内容主要是基于Python的“百货商场用户画像描述与价值分析”,里面有详细的数据预处理、数据可视化和数据建模等步骤。同时,针对传统RFM模型进行了改进,构造了LRFMP模型来分析客户价值,挖掘客户价值的八个字段,并通过WordCloud形式展现了出来,可以对会员用户进行精准画像。
数据集分为两部分,.xlsx结尾的是会员信息表,.csv结尾的是销售流水表。其中,会员信息表共有将近19万条记录,销售流水表共有接近189万条记录,其包括2015-01-01到2018-01-03之间所产生的数据。
目标:
本项目主要围绕着“百货商店会员用户画像描绘与价值分析”内容进行,结合目前百货商场的数据情况,可以实现以下目标:
- 借助百货商场会员用户数据,对会员用户进行分群。
- 对不同的会员用户类别进行特征分析,比较不同类别会员用户的会员用户价值。
- 对不同价值的会员用户类别提供个性化服务,制定相应的营销策略。
所需要的包及代码模版
2.1、项目背景与挖掘目标
从上面可以简要看出,数据中会员卡号存在一些重复值,且会员入会登记时间都有缺失,需要去重去缺失值,因为性别比例缺失较少,故用众数来填补性别上的缺失值
销售流水表数据探索和预处理
可以看到,舍弃掉会员卡号缺失值之后,便只有柜组名称存在缺失,下面舍弃掉一些无意义的字段,仅保留对本项目有研究价值的字段信息
2.2、将会员信息表和销售流水表关联与合并
这里可以看到,merge之后的数据异常值突然变多了,这里就需要对此进行预处理,筛选掉那些异常值,方便后续进行分析
3.1、分析会员的年龄构成、男女比例等基本信息
3.2、分析会员的总订单占比,总消费金额占比等消费情况
3.3、分别以季度和天为单位,分析不同时间段会员的消费时间偏好
消费偏好:我觉得会稍微偏向与消费的频次,相当于消费的订单数,因为每笔消费订单其中所包含的消费商品和金额都是不太一样的,有的订单所消费的商品很少,但金额却很大,有的消费的商品很多,但金额却特别少。如果单纯以总金额来衡量的话,会员下次消费时间可能会很长,消费频次估计也会相对变小(因为这次所购买的商品已经足够用了)。所以我会偏向于认为一个用户消费频次(订单数)越多,就越能带来更多的价值,从另一方面上来讲,用户也不可能一直都是消费低端产品,消费频次越多用户的粘性也会相对比较大
4.1、构建会员用户基本特征标签
消费产生的时间存在异常值的数量为:469 登记时间存在的异常值数量为:36
筛除全部异常值之后数据的记录数为:393006 共有16个字段
以上就是本篇文章【数据分析-04-百货商场用户画像描述与价值分析(包含代码和数据)】的全部内容了,欢迎阅览 ! 文章地址:http://dfvalve.xrbh.cn/news/8000.html 资讯 企业新闻 行情 企业黄页 同类资讯 首页 网站地图 返回首页 迅博思语资讯移动站 http://keant.xrbh.cn/ , 查看更多